Cómo crear una aplicación de asistente de voz para Android

Si está planeando crear una aplicación de Asistente de Voz, entonces debería ser bueno en CODIFICACIÓN (pruebe freecodecamp para aprender codificación gratis) y su WEBVIEW debería ser único.

Si no desea pasar por el proceso de Codificación, use GOOD BARBER que le permite tomar el control de cada detalle de su aplicación sin producir una sola línea de código.

Ahora, antes que nada, crea una nueva clase y dale un nombre, estoy usando SIRIWEBVIEW. Si intenta desarrollar sus componentes nativos para Call Outs, sería difícil manejar todos los formatos en el cliente y desplazar todos los elementos, etc. Lo que le aconsejo es que puede crear una vista web personalizada y agregar sus llamadas formateadas fácilmente. Me gusta esto

Después de preparar la vista web, debemos agregar dos nuevas funciones a esta clase, una para inicializarla, y la segunda es agregar una nueva llamada. Ahora se requiere codificación y estoy dando un pequeño ejemplo de codificación (fragmento de código) como este

public void AddNewCallOut (mensaje de cadena, boolean ismsgResponse) {
elementId = elementId + 1;
StringBuilder messageBuilder = new StringBuilder ();

if (! message.contentEquals (“”)) {

if (! ismsgResponse) {
messageBuilder
.append (“

“);
messageBuilder
.append (“

“);

La función toma dos parámetros, son mensaje e isResponse. Puede escribir su mensaje como una cadena y establecer el valor del parámetro isResponse para llamar a la función cuando desee agregar una nueva llamada. El parámetro IsResponse muestra si el mensaje es una respuesta del Asistente o no. Ese parámetro cambia el color de la llamada y desliza el desplazamiento. En las primeras líneas de función puede ver el parámetro elementId. ElementId es importante para deslizar los objetos.

Después de crear su propio componente, puede agregarlo a su main_activity.xml como se muestra a continuación

<com.example.siriui.SiriWebView
android: id = “@ + id / webview”
android: layout_width = “fill_parent”
android: layout_height = “fill_parent”
android: keepScreenOn = “true”

Una vez hecho esto, el siguiente paso será la COMPRESIÓN DE AUDIO para su Asistente de voz

La compresión de audio reduce el tamaño de los datos de audio. Los datos de audio comprimido se pueden transferir más rápidamente a través de la red GSM. El tipo de compresión puede ser con pérdida y sin pérdida.

Pérdida: el método puede reducir la cantidad de datos durante el proceso de codificación. Sin embargo, los datos retenidos son aceptables para el reconocimiento. La ventaja del método con pérdidas es que los datos pueden ser más pequeños.

Sin pérdida: a través de este método, el audio se puede comprimir sin perder su calidad original. Es importante si las herramientas de reconocimiento o grabación no tienen ningún proceso de reducción de ruido.

Parte de la reducción de datos no afecta directamente la calidad de los datos del habla. Simplemente, si los datos de audio grabados se utilizarán para el reconocimiento de voz, los datos que no son útiles para el reconocimiento de voz se pueden reducir. La sensibilidad auditiva humana está en frecuencia audible de 20 Hz – 20 KHz. El exterior del rango se puede eliminar.

G.711: puede usar el estándar G.711 para la compresión de audio. El método de compresión es sin pérdidas. Puede comprimir sus datos hasta en un 50 por ciento.

Se pueden utilizar otros métodos: MPEG-1 Layer III (MP3), MPEG-1 Layer II Multicanal, MPEG-1 Layer I, AAC, HE-AAC, MPEG Surround, MPEG-4 ALS, MPEG-4 SLS, MPEG- 4 DST, MPEG-4 HVXC, MPEG-4 CELP, USAC, G.718, G.719, G.722, G.722.1, G.722.2, G.723, G.723.1, G.726, G.728 , G.729, G.729.1, Speex, Vorbis, WMA, Codec2.

Por lo tanto, después de completar todo este trabajo, se desarrollará su APLICACIÓN DE ASISTENTE DE VOZ .

Si no desea pasar por el proceso de Codificación, use GOOD BARBER que le permite tomar el control de cada detalle de su aplicación sin producir una sola línea de código.

Probablemente la forma más fácil es usando Pandorabots CallMom ™. Creo que Pannous participó en el desarrollo de CallMom y ofrece varias API en Mashape. Pandorabots también tiene una nueva API disponible en chatbots.io.

Guile Lindroth parece estar a punto de lanzar una versión móvil de su asistente virtual personalizable Guile3D Denise, aunque no es un verdadero espejo o extensión del popular asistente de escritorio, sino más bien como un producto adicional.

Las buenas opciones de código abierto incluyen el Programa O basado en PHP, así como el galardonado ChatScript de Bruce Wilcox (que nuevamente ha ganado el Premio Loebner para 2014).

Eche un vistazo a esta cita del artículo Cómo crear aplicaciones de asistente virtual como Siri y Google Assistant

Cómo incluir un asistente de voz en una aplicación

Hay tres formas de hacer que su aplicación entienda el lenguaje verbal y mantenga una conversación.

El primer método

El primer método consiste en integrar las tecnologías de voz existentes en su aplicación mediante API especiales y otras herramientas de desarrollo.

El segundo método

El segundo método le permite crear un asistente inteligente con la ayuda de servicios de código abierto y API.

El tercer método

El tercer método representa el desarrollo de un asistente de voz desde cero con su mayor integración en su aplicación.

Cada método es digno de atención. Tenga en cuenta que los grandes nombres como Apple o Google ofrecen a regañadientes sus creaciones queridas a los desarrolladores de terceros. Por otro lado, el uso de herramientas de código abierto puede no cumplir con sus expectativas. Además, desarrollar aplicaciones como Siri por su cuenta puede convertirse en una tarea imposible.

Para aclarar todos los beneficios y riesgos que enfrentará, consideremos cada enfoque en detalle.

Formas comunes de integrar su aplicación con un asistente virtual


+ mensaje + “