Cómo recopilar información de un seminario web / video instructivo más rápido

Aún faltan algunos años para que el reconocimiento de voz convierta el habla no estructurada, como videos, debates, entrevistas, en texto inteligible de manera confiable .

Los discursos políticos y de otro tipo podrían funcionar bastante bien, porque tienen un cierto patrón y generalmente son gramaticalmente correctos. Y esos micrófonos de TV o radio son de buena calidad. Las personas que usan el micrófono incorporado de su computadora portátil para grabar seminarios web son más difíciles de procesar debido a los dispositivos de entrada de audio de baja calidad y al ruido ambiental. Y esto además de los comentarios no estructurados a las diapositivas. Luego agregue varios altavoces y tendrá un verdadero desafío técnico.

Sin embargo, la empresa alemana Linguatec (Voice Pro Enterprise) ofrece un producto donde puede cargar videos o archivos de audio y transcribirlos. Puede comprar paquetes prepagos de diez horas para probarlo. Puede o no funcionar. Pero si desea reconocimiento de voz, este es actualmente el único producto disponible comercialmente que conozco.

En cuanto a otras formas de recibir los bits importantes: el concepto clave es la delegación. Si la información del video es tan importante,

  • encuentre algún servicio de transcripción en un país del tercer mundo y pídales que transcriban el video a inglés simple para usted. Puede ser la solución más barata. (En cuanto a la búsqueda de dichos servicios, puede buscarlos en Google, probar Mechanical Turk de Amazon o utilizar un asistente virtual que se puede encontrar en elance o en un sitio similar [no afiliado]).
  • o encuentre un pasante o asistente que revise los videos y le envíe los fragmentos interesantes. Como beneficio adicional, el uso del reconocimiento de voz para volver a analizar el contenido puede ser más rápido para algunos usuarios que la transcripción manual. Un buen software de reconocimiento de voz para Mac o Windows se puede obtener en los EE. UU. Por aproximadamente $ 100 (Dragon Dictate o Dragon NaturallySpeaking Premium, respectivamente).

Compare costos y encuentre la mejor solución para usted.

Por cierto, si alguien conoce un servicio que puede convertir de manera confiable y automática la voz no estructurada en texto, hágamelo saber.