¿Qué tan complicado es crear funcionalidades de reconocimiento de imágenes personalizadas en mi aplicación web? ¿Algún estadio sobre costos y tiempo?

Descargo de responsabilidad: soy fundador de Custom Image Recognition API – Vize.ai

Si está buscando una funcionalidad de reconocimiento de imagen personalizada en su aplicación, en realidad tiene múltiples opciones.

Primero, puede intentar hacerlo usted mismo a través de TensorFlow, por ejemplo. Tienen una guía bastante fácil de usar en su sitio web. Sin embargo, la implementación puede llevarle mucho tiempo y agrega complejidad a su aplicación y a su lado.

Otra opción es usar plataformas de reconocimiento de imágenes personalizadas , que ofrecen visión por computadora avanzada como un servicio. La implementación en su sitio web se realiza fácilmente a través de RESTful API. Todos ellos también ofrecen una amplia documentación y recursos.

Hay varios proveedores de reconocimiento de imágenes personalizados como Clarifai, customvision.ai de Microsoft y Vize.ai. Microsoft ingresó al campo de reconocimiento de imágenes personalizadas recientemente. Le permite agregar categorías personalizadas a modelos generales y reconocerlas. Vize.ai se centra en el reconocimiento de imágenes personalizadas muy preciso para tareas muy específicas. Cada modelo de usuario está entrenado desde cero con parámetros específicos que permiten una precisión mucho mayor. Puede entrenar y administrar fácilmente el modelo entrenado a través de la interfaz web.

Todos los servicios ofrecen precios muy competitivos en comparación con el desarrollo y el mantenimiento de la solución usted mismo.

En realidad, puede utilizar el punto final de API de entrenamiento personalizado de Clarifai, bastante simple y directo. Para javascript, declarar un positivo es:

clarifai.positive (‘ http://example.com/image.jpg&#039 ;,’ car ‘, devolución de llamada);

Y una negativa es:

clarifai.negative (‘ http://example.com/another-image.jpg&#039 ;,’ auto ‘, devolución de llamada);

Cuando predices una imagen, haces:

clarifai.predict (‘ http://example.com/some-new-image.jpg&#039 ;,’ auto ‘, devolución de llamada);

Y luego te da una probabilidad con respecto a la semejanza de la foto con lo que has entrenado. La API de Clarifai también tiene una entrada de etiquetado que es extremadamente precisa con algunas etiquetas básicas. La API también es gratuita para un cierto número de llamadas / mes. Definitivamente vale la pena echarle un vistazo!

¿Qué significa exactamente el reconocimiento de imagen personalizado?
¿Está buscando algo como detección de rostros o conversión de imagen a texto
La complejidad y precisión del patrón de coincidencia define el costo y el tiempo.

Hay pocas bibliotecas que proporcionan esta funcionalidad.
Para el reconocimiento de texto, puede usar la biblioteca a continuación.
Reconocimiento óptico de caracteres en Javascript

Para la detección de rostros
Reconocimiento facial con Javascript y Mashape – Mashape Blog

Construir una infraestructura de reconocimiento de imágenes precisa, escalable y robusta no es una tarea fácil. Las soluciones profesionales pueden ser más baratas y funcionar mejor. Puede encontrar una publicación de blog relacionada a continuación:

https://www.linkedin.com/pulse/5

No es complicado si no es complicado para ti. Por lo general, las técnicas de reconocimiento personalizadas, como los clasificadores de cascada de Haar, toman entre 5000 y 10000 imágenes para entrenar. Entonces, si está usando algo así, aproximadamente 1 semana.