¿Qué opciones hay para implementar el reconocimiento de imágenes en una aplicación web?

Si está buscando una solución basada en API, puede consultar Sightengine.com

Es posible analizar 2,000 imágenes gratis por mes.

Es una solución automatizada para detectar cosas como contenido para adultos, violencia, rostros y celebridades en imágenes y videos .

La API analiza imágenes y videos más rápido que los humanos. La API puede analizar varios millones de imágenes por día.

Digamos que quieres subir esta imagen y detectar caras:

Aquí hay un ejemplo en Python, usando el SDK:

cliente = SightengineClient (‘{api_user}’, ‘{api_secret}’)
output = client.check (‘face-atributos’) .set_url (‘https://d3m9459r9kwism.cloudfront.net/img/examples/example-coup-1000.jpg’)

La salida devolverá la clasificación. Un ejemplo:

“status”: “éxito”,
“solicitud”: {
“id”: “req_1VmdzS10f628UBstXdc8c”,
“marca de tiempo”: 1510757582.1956,
“operaciones”: 1
},
“caras”: [
{
“x1”: 0.5698,
“y1”: 0.24,
“x2”: 0.6773,
“y2”: 0.492,
“caracteristicas”: {
“ojo izquierdo”: {
“x”: 0.6507,
“y”: 0.3533
},
“Ojo derecho”: {
“x”: 0.6276,
“y”: 0.328
},
“punta de la nariz”: {
“x”: 0.6391,
“y”: 0.3773
},
“left_mouth_corner”: {
“x”: 0.6222,
“y”: 0.4307
},
“right_mouth_corner”: {
“x”: 0.5964,
“y”: 0.412
}
},
“atributos”: {
“hembra”: 0,14,
“hombre”: 0.86,
“menor”: 0.04,
“gafas de sol”: 0.2
}
},
{
“x1”: 0.6516,
“y1”: 0.3173,
“x2”: 0,7529,
“y2”: 0.5693,
“caracteristicas”: {
“ojo izquierdo”: {
“x”: 0.7493,
“y”: 0.4453
},
“Ojo derecho”: {
“x”: 0,7067,
“y”: 0.4253
},
“punta de la nariz”: {
“x”: 0.7404,
“y”: 0.4787
},
“left_mouth_corner”: {
“x”: 0.7342,
“y”: 0,52
},
“right_mouth_corner”: {
“x”: 0.6951,
“y”: 0.5027
}
},
“atributos”: {
“hembra”: 0,97,
“hombre”: 0.03,
“menor”: 0,37,
“gafas de sol”: 0.01
}
}
],
“medios”: {
“id”: “med_1Vmd6qHpJNWZy053MOT0L”,
“uri”: “https://d3m9459r9kwism.cloudfront.net/img/examples/example-coup-1000.jpg”
}
}

Aquí hay un ejemplo del resultado:

Puedes probar la página de demostración: Demo

(descargo de responsabilidad: yo trabajo allí)

La manera más fácil que sé para implementar la función que solicitó es mediante el uso de las API de visión por computadora de Microsoft Azure.

¡Ellos son increíbles!

Simplemente les da una imagen y obtiene un archivo .json con todo lo que necesita saber sobre la foto y la confianza de la predicción.

La aplicación más alucinante es hacer que se reconozca su texto escrito a mano.

¡Mire, incluso puede reconocer el Coliseo con un 94.4% de confianza!

¡Su aplicación sería extremadamente fácil de hacer con solo saber cómo manejar archivos .json básicos!

Aquí hay un enlace a las API

Otras opciones son:

  • Google
  • IBM Watson Developer Cloud
  • CloudCV

More Interesting

Cómo crear una estrategia de SEO

Cómo escribir una aplicación web en 'C'

¿Qué pasó con Omnisio después de su adquisición por parte de Google?

¿JSON eliminará XML de la imagen? ¿O las dos alternativas están destinadas a quedarse?

¿Dónde puedo encontrar Tutoriales para desarrollar una aplicación web usando django, para alojar en el motor de aplicaciones de Google?

Como programador de 'nivel intermedio' que solo trabaja en el backend de la aplicación web de una startup, ¿qué tan preocupado debería estar por las lagunas de seguridad que podría estar creando involuntariamente, incluso si soy capaz de acelerar las cosas rápidamente?

¿Es correcto que una aplicación web sea un software que nos permite acceder a un sitio web?

Referencia cruzada múltiples relaciones de muchos a muchos. ¿Qué base de datos debo elegir?

Estoy pensando en desarrollar una aplicación de servidor cliente corporativo usando Uniface. ¿Cómo se han desarrollado tus experiencias en Uniface? ¿Qué otras herramientas considerarías evaluar?

¿Cuál es una buena alternativa a la Lista de tareas pendientes de Basecamp?

¿Cuál es la mejor alternativa a iCal para usar como calendario compartido para proyectos de la empresa?

¿Qué Framework PHP es el mejor para desarrollar un sitio de redes sociales con funcionalidad Chat, Calendario, Eventos, Gestión de tareas y cuenta con pasarela de pago?

¿Qué se necesitará para hacer realmente accesible la web?

¿Cuál es la diferencia entre aplicaciones web progresivas y aplicaciones híbridas?

¿Qué debo elegir para una aplicación web altamente personalizada en R, Shiny vs. OpenCPU?