Biblioteca de comandos de voz rápidos en Android, código abierto, funciona sin conexión

Quiero agregar control de voz a mi aplicación Android de código abierto.

El vocabulario que necesito no es grande, solo 5 comandos simples: "Mostrar", "Otra vez", "Difícil", "Bien", "Fácil".

¿Qué biblioteca puedo usar para esto?

Requisitos:

  • Reconocimiento rápido, menos de medio segundo
  • Debe ser de código abierto
  • NO debe depender de bibliotecas no abiertas como Google Play Services u otras
  • Preferiblemente no muy grande
No es que tenga algo en mente (no soy un desarrollador de Android;), pero: ¿debería funcionar sin conexión y no usar los servicios (propietarios) de Google (o cualquier otra cosa en la nube)? Si ese es el caso, no olvide actualizarnos con los detalles una vez que haya terminado, ya que "escucha de Google" y "se requiere red" son mis principales argumentos en contra de usar tales cosas :)
@Izzy: Actualizado. Mi aplicación se usa mucho en China, donde la mayoría de los teléfonos no tienen Google Play Services.
¡Gracias, Nicolás! Eso me hace aún más curioso, ya que el control de voz sin eso sería algo que realmente me interesaría (votado a favor, destacado;)

Respuestas (2)

Entonces, la única biblioteca de la que he oído hablar que podría funcionar es Pocket Sphinx

Solo he usado la versión de escritorio Sphinx, pero creo que podría hacer lo que necesita. Tendría que crear su propio archivo de gramática, pero supongo que sería bastante fácil según su breve lista de palabras requeridas.

La licencia se parece a la licencia BSD.

¿Cuánto crees que crecerá mi APK después de agregar todas las bibliotecas necesarias y los datos de reconocimiento para los 5 comandos de voz simples de la pregunta? ¡Gracias!

Puede probar Pocketsphinx para crear reconocimiento de voz sin conexión.
Pero puede probar esta biblioteca para un uso fácil sin tener que lidiar con los activos de Pocketsphinx y la configuración de RapidSphinx . Esa biblioteca puede construir un diccionario y un modelo de lenguaje (Archivo Arpa) sobre la marcha.

¿Cuánto crecerá mi APK después de agregar todas las bibliotecas necesarias?
Me alegro poder ayudarte. El archivo más grande de la biblioteca es el archivo de diccionario, tiene unos 3,2 Mb y el total de mi biblioteca con códigos es de unos 3,5 Mb. Es de tamaño estándar de Pocketsphinx. Y también solo se creará un registro de audio a partir de esta biblioteca, por lo que si intenta grabar nuevamente, se reemplazará el registro de audio anterior. Así que no te preocupes. Hágame saber si necesita la nueva característica de esta biblioteca con la creación de un problema en GitHub.