¿Qué necesito aprender para crear una aplicación de iOS que capture texto de fotos y luego procese esa información y se la envíe al usuario?

Considere trabajar con el aprendizaje automático. En lo que describe, está arreglando categorías para propiedades. Supone que todos los recibos provienen de un restaurante, por lo que debe conocer todos los posibles nombres de restaurantes antes de que alguien pueda escanear un recibo.

Lo que haría es trabajar con los datos espaciales del recibo y los bloques de texto que tiene. Trate de averiguar si puede encontrar una manera que sepa cuál es el nombre del restaurante, antes de compararlo con una lista de posibles restaurantes. Para los precios, puede buscar patrones comunes, como números y símbolos de moneda.

Además, tenga en cuenta que ya hay aplicaciones y productos que hacen lo que está a punto de hacer. Solo en los Países Bajos hay 2 o 3 aplicaciones que pueden reconocer recibos e insertarlos directamente en el software de contabilidad. Sin embargo, no deje que esto lo deprima, solo úselo como entrada para determinar su propuesta de valor.

Related Content

Soy ingeniero de CS y tengo un MBA (marketing) y estoy listo para ser autónomo. ¿Debo aprender iOS o desarrollo web front-end?

¿Cuál es la configuración de desarrollo de prueba para la aplicación iOS en las principales empresas de nueva creación?

¿Cuáles son las probabilidades de que una aplicación realmente genere millones en iOS y / o Android?

Cómo encontrar errores en una aplicación (Android, iOS)

¿Cuáles son las ventajas / desventajas del proceso de inicialización de dos pasos en Objective-C?

Cómo usar una aplicación para iPhone si no tengo un iPhone

¿Qué herramientas se utilizan para hacer animaciones de video 2D HD simples?

Quizás necesite un escáner móvil de documentos SDK o tecnología OCR.

El reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) es una tecnología que puede escanear y extraer fácilmente el texto de las imágenes del documento y luego convertirlas en archivos editables y con capacidad de búsqueda.

He usado una aplicación de escáner móvil de documentos llamada Docs Matter. Puede escanear el documento que tiene y recuperar la información de las imágenes del documento. Puede editar los resultados del reconocimiento y guardarlos en teléfonos móviles. También puede convertirlos a archivos de formato PDF, Word, Texto. Sincronícelos con la nube; compártelos con otros al instante. Busque rápidamente el documento que necesita ingresando algunas palabras clave en todo momento.

¿Crees que es lo que quieres? Tal vez pueda probar Docs Matter – Escáner móvil – Tecnología Yunmai para probarlo. La aplicación que utilicé es para Android. Pero puedes contactar a la compañía, mi amigo trabaja allí y dijo que parece que tienen una versión de iOS.

Emin İlker Çetinbaş

Necesita una biblioteca OCR (reconocimiento óptico de caracteres) para convertir la imagen en texto. Es posible que necesite preprocesar la imagen para obtener mejores resultados, como recortar la parte relevante, ajustar el brillo y el contraste, lo que se puede hacer con iOS SDK. También debe tener una biblioteca de restaurantes y comidas, para que pueda identificar McDonald’s como restaurante, pepitas como comida, etc.
Para OCR, Tesseract-OCR parece una buena opción.

May Lin

More Interesting

¿Por qué el iOS 11 de Apple tiene tantos errores en cada actualización?

¿Cuándo debo usar el GCD? ¿Cuándo debo usar NSOperation?

¿Es factible comenzar como desarrollador de iOS sin ningún conocimiento previo de programación?

Desarrollo de IOS vs modelado 3D, ¿cuál es más demandado? Y más estabilidad. Ya tengo 35 años.

¿Cuál es el mejor libro para el desarrollo de Objective-C para Mac?

¿Dónde se encuentran los desarrolladores de iPhone remotos asequibles?

¿Cuál es la mejor manera de reclutar desarrolladores de iPhone realmente inteligentes para una startup que acaba de recaudar un buen dinero angelical?

Fui aceptado en un bootcamp de desarrollo IOS en los Estados Unidos (Make School). La matrícula es de $ 7000 excluyendo viaje + habitación + pensión. ¿Vale la pena?

¿Cómo funciona la implementación de TestFlight?

¿Qué necesito aprender o hacer para ser un desarrollador sénior o gerente de proyectos?

¿Por qué no se puede cambiar el tiempo de contraseña requerido al activar la identificación táctil para desbloquear la pantalla?

Si compro una aplicación para iOS, ¿necesito obtener un archivo de firma?

¿Vale la pena aprender Swift con la intención de ganar dinero como desarrollador de iOS?

¿Cómo se compara Sparrow con Cocos2d para el desarrollo de juegos iOS?

¿Cómo puedo construir un compilador de iOS en línea?

Web Analytics