¿Siri puede entender su propia voz?

Es un experimento interesante para probar, pero en teoría debería funcionar mal.

El reconocimiento de voz automático (ASR), o voz a texto, se entrena en base al reconocimiento de patrones del habla humana. Intenta encontrar la mejor coincidencia entre una serie desconocida de señales acústicas y una lista de combinaciones de secuencia aceptables de esos sonidos para un idioma determinado. Está prediciendo lo que es más probable que sea correcto.

La síntesis de voz, o texto a voz (TTS), se ejecuta en principios completamente diferentes. En general, no se trata de predecir nada, ya que todo el texto está allí. (Aunque tiene que tomar decisiones, como si “St.” se pronuncia “calle” o “santo”, y si “Houston” se pronuncia como la ciudad de Texas o la calle de Nueva York). Está formando una corriente de sonido y siguiendo diferentes reglas para tratar de hacer que suene lo más humano posible. TTS se pone cada vez mejor cada año, pero sigue siendo un poco antinatural, como cualquiera que escuchara a Siri le diría.

Lo único que ambos pueden compartir es el mismo léxico o vocabulario; es decir, tener un diccionario de palabras y saber pronunciarlas. Están trabajando en el mismo libro de jugadas, si lo desea. Pero aparte de eso, ASR está operando independientemente de TTS, y el uso de la entrada TTS a un sistema ASR entrenado en patrones vocales de personas reales tendrá una tasa de error más alta que para el habla humana. (Teóricamente, al menos).

Solo puse mis dos teléfonos uno al lado del otro y los hice hablar. Le pregunté a Siri: “Siri, ¿cómo te sientes hoy?” y luego encendió rápidamente el micrófono del otro. Los resultados:

Es curioso que la segunda omitiera mi nombre de la pregunta, como si quisiera ignorar el hecho de que la primera Siri me estaba hablando a mí, no a ella 🙂

Supongo que hay espacio para la diversión aquí, pero al final … son solo dos algoritmos que se hablan entre sí.

En cuanto a si la parte del habla está vinculada al reconocimiento, es una pregunta interesante, pero supongo que no, es probable que sean dos algoritmos independientes.

Si cariño !! Solo mira estos videos;

y este con nuevos dispositivos: un poco divertido 😀

Gracias !!!

PERO, cuando SIRI se encuentra con el asistente de voz de SAMSUNG;

Eso es todo !

More Interesting

¿Cuáles son las características adicionales que tiene Windows Phone 7 (después de la actualización de Mango) que no están presentes en iOS ni en Android?

Tengo 22 años y estoy aprendiendo Swift / Xcode. Quiero ser un desarrollador de iOS. ¿Qué sabe y tiene el típico desarrollador de iOS en su currículum para ser empleable?

¿Cuándo se solucionará en Quora la representación [matemática] \ LaTeX [/ matemática] (móvil)?

¿Veremos otro sistema operativo móvil en los próximos 10 años con un sistema de ecosistema tan grande como Android e iOS o serán irremplazables?

¿Qué aplicaciones de mejora del sueño para iOS filtran la luz azul y no requieren jailbreak?

¿Qué es el desarrollo de aplicaciones iOS?

¿Qué es mejor, Android Lollipop o iOS 8?

¿Qué sistema operativo es mejor, Android O o iOS 11?

¿Cómo puedo construir mi propia tableta usando partes de diferentes tabletas?

¿Qué dispositivos iOS debe tener un desarrollador novato para asegurarse de que su aplicación funcione bien para todos los usuarios?

¿Merece la pena liberar un dispositivo iOS o Android?

¿Qué tan grande es el papel que juega 3D Touch en iOS 10?

¿Podemos desarrollar una aplicación para iOS con algunos gráficos en el nuevo MacBook?

¿Cuál es el mejor sistema operativo, Android o iOS?

¿Qué tecnología utiliza el Servicio de notificaciones push de Apple iOS (APNS) para mantener una conexión persistente con cada dispositivo para recibir notificaciones push tan rápidas?