¿Existe un asistente personal de código abierto para la web, como la extensión Speak to It Chrome que se puede personalizar?

Hay diferentes aspectos de esto a considerar. La mayoría de los “motores” del lenguaje natural (llamados “sistemas de diálogo”) están basados ​​en texto. Agregar tanto entrada de audio como salida de audio son niveles adicionales de complejidad. Y agregar un sistema de avatar animado es otra capa más.

La respuesta breve es que no conozco ningún kit de bricolaje para hacerlo en la web . Tradicionalmente, estos “agentes” agrupados eran principalmente para máquinas de escritorio (aprovechando la API de Microsoft Speech, por ejemplo). En general, tanto el video como el audio dependen del navegador web, y las guerras del navegador dificultaron que las cosas funcionen en todas las plataformas (al igual que los problemas que hacen las aplicaciones móviles multiplataforma en la actualidad). Recientemente, la “API de Web Speech” basada en Chrome inicialmente indocumentada de Google estuvo disponible para los desarrolladores.

Pandorabots CallMom ™ es un sistema de bricolaje que aprovecha la API de Google Speech. Creo que CallMom también hace uso de Pannous “Voice Actions” (también conocido como Jeannie Voice Actions); las acciones de voz (facturadas “Siri como servicio”) y las API de Jeanie están disponibles a través de Mashape. Ver también Pannous en GitHub.

Referencias

  • IMified se suspenderá el 1 de septiembre de 2012
  • Asistente virtual móvil Pandorabots CallMom ™
  • Verbots Online cierra a fines de agosto

Sé de un sistema que parece ofrecer los componentes básicos de lo que estás buscando. Se llama http://wit.ai

http://techcrunch.com/2014/03/17

Lo usarías para crear tu propio agente. No lo he probado, pero se ve fantástico. Estoy muy interesado en ver si wit.ai se convierte en un éxito comercial porque planeo usarlo en algunos de mis proyectos de desarrollo.