Dispositivos móviles: ¿podrían las mejoras en el software que convierten la escritura y la voz en texto volver obsoleto el teclado físico?

Las interfaces multitáctiles (como los iDevices y los androides) ya han ganado una amplia adopción. Las interfaces de gestos (al estilo de Kinect) están siguiendo. No sé acerca de usted, pero encuentro que las interfaces de voz para dispositivos portátiles son muy molestas, y no conozco a nadie más que las use. El BlackBerry cuando lo toco en el lugar equivocado siempre me pregunta “Diga un comando”. Odio eso, y nunca he aprendido cómo usarlo, tal vez algunas personas que conducen mucho sí.

La aplicación práctica de la voz al texto exige más asistencia humana de la que puedas imaginar, y no es como si mecanografiara, pasara el mouse o deslizase, las máquinas, como se ha señalado en otros lugares por los que responden aquí, no tienen la inteligencia suficiente para entender el individuo. contexto propio, particularmente no en el momento.

Dragon funciona para aquellos que tienen mucha paciencia. Durante todos estos años, creo que he visto a un periodista usando algo como Dragon, y lo estaba usando combinando voz a texto con su propia escritura. Era extraño sentarse detrás de él en una conferencia verlo hablar en su computadora portátil, y está claro que no podía hablar si alguien estaba en el escenario. Pero para él, fue productivo. Esa es la multitud del uno por ciento, que no constituye una adopción.

Creo que el reconocimiento de escritura requiere una cantidad igual de paciencia, si no más. Entrenar el dispositivo puede funcionar la mayor parte del tiempo, pero no todo. Así que te quedas con problemas con el resto.

Las interfaces cerebro-máquina (IMC) para discapacitados son muy prometedoras. Es un grupo de usuarios que tiene un fuerte incentivo para aprender y entrenar la interfaz. Es un nicho, pero importante. Krishna Shenoy en Stanford, entre otros, ha hecho un buen trabajo en esta área: http://med.stanford.edu/news_rel…

Por lo tanto, mucho depende de la generalización de las interfaces para una variedad de aplicaciones. Teclado / mouse y multitáctil son altamente generalizables. Muchas de las otras interfaces requieren áreas de aplicación más específicas. Un comando de voz a un GPS es un ejemplo de un área de aplicación específica o una respuesta de voz interactiva (IVR). Cualquiera que intente comunicarse con el servicio al cliente en un operador de telecomunicaciones sabe que todavía tenemos serios problemas con ellos. Amdocs está mejorando los IVR, entre otras aplicaciones que desarrolla, con la ayuda de una base de triple tienda que permite más contexto de aplicaciones y conectividad. Sé que Bill Guinn hablará sobre esa tecnología en SemTech este junio: http: //semtech2011.semanticweb.c…

Algo que muchos no han pensado que Amdocs aparentemente tiene: cómo puede mejorar la aplicación de algo como el reconocimiento de voz al volver a visitar la infraestructura y la información que recopila, integra y analiza. Los problemas con los datos, las aplicaciones y las capas de presentación / interfaz están todos entrelazados. Lo que corresponde a más desarrolladores para obtener conocimiento sobre cada una de estas capas. La capa de datos es la que más necesita mejorar en este momento.

Algunos números interesantes para poner esta pregunta en perspectiva.

Velocidad de escritura promedio: 33-40 WPM
Tasa de expresión promedio: 150-160 WPM
Tasa promedio de escritura: 31 WPM

Los profesionales promedian aproximadamente 70 WPM escribiendo (estoy personalmente en el rango de 60-70 WPM).

Si bien creo que a la larga el teclado podría volverse obsoleto, no hay una razón apremiante para que lo haga durante mucho tiempo. Si bien la velocidad del habla parece ser una mejora, eso dependería de que el hardware en cuestión sea capaz de comprender al mismo ritmo que el cerebro humano y probablemente requiera una edición de seguimiento para lidiar con palabras no intencionadas y rellenos verbales. Como cualquiera que haya utilizado la transcripción o el reconocimiento de voz modernos puede decirle, tenemos algo de trabajo por delante antes de que este sea realmente un reemplazo factible.

Tomé estos números del artículo de Wikipedia sobre palabras por minuto y los números coinciden con lo que recuerdo haber leído en el pasado sobre este tema.

http://en.wikipedia.org/wiki/Wor

Para aquellos de nosotros que escribimos software, sin palabras reales, o trabajamos en medicina u otras profesiones con lenguaje oscuro, probablemente no.

Creo que la divergencia entre los dispositivos de creación de contenido y las máquinas de consumo de medios está sobre nosotros. Los dispositivos a través de los cuales consumimos medios no necesitan teclados físicos. Además, los dispositivos que son pequeños (lectura – teléfonos celulares) ya no necesitan acomodar teclados físicos, pero esto se debe más a las mejoras en las interfaces táctiles que a la escritura a mano o el reconocimiento de voz.

Realmente no puedo soportar mi letra. Es escaso, y pierdo la noción de dónde estoy, y me duelen las manos muy rápido. Pero puede escribir por edades.
Y me siento extraño hablando con mi computadora. Me gusta hablar con la gente.