Cómo usar CMUSphinx para Android para reconocer el habla continua con el modelo de idioma

La demostración de Android de Pocketsphinx incluye un amplio reconocimiento de vocabulario con un modelo de idioma (parte del pronóstico). Hay un modelo de idioma más grande para el idioma inglés disponible para descargar, por ejemplo, el modelo de idioma genérico En-US.

El código simple para ejecutar el reconocimiento es así:

recognizer = defaultSetup()

.setAcousticModel(new File(assetsDir, "en-us-ptm"))

.setDictionary(new File(assetsDir, "cmudict-en-us.dict"))

.getRecognizer();

recognizer.addListener(this);

// Create large vocabulary search

recognizer.addNgramSearch(NGRAM_SEARCH, new File(assetsDir, "en-us.lm.bin"););

// Start the search

recognizer.startListening(NGRAM_SEARCH);

Sin embargo, no son fáciles de encajar en el dispositivo y decodificar en tiempo real. Si desea decodificar el habla en tiempo real con un vocabulario amplio, necesita transmitir audio a un servidor. O necesita restringir el vocabulario y el idioma a un pequeño subconjunto de inglés genérico. Puede obtener más información sobre el reconocimiento de voz en el Tutorial CMUSphinx para desarrolladores