¿Existe un servicio de transcripción de máquina en tiempo real (transmisión) que permita incluir scripts como material de capacitación para el reconocedor de voz?

Question

¿Existe un servicio de transcripción de máquina en tiempo real (transmisión) que permita incluir scripts como material de capacitación para el reconocedor de voz?

Software
transcripción

daniel newmann

Este es mi caso de uso: tengo guiones para charlas que tienen una precisión del 90-95% de lo que realmente dirá el orador. Estoy buscando un servicio en el que pueda cargar esos guiones y, mientras el orador habla, un servicio de transcripción automática devolverá automáticamente los resultados en tiempo real, utilizando tanto los guiones como el reconocedor integrado para ofrecer resultados de mayor calidad que el reconocedor incorporado solo.

Soy consciente de que con Google Cloud Speech API, puedo obtener resultados de transmisión, y con sugerencias de frases puedo proporcionar algo de contexto en la entrada, pero el límite de tiempo en las sesiones de transmisión (1 minuto) y el requisito de dividir mi entrada en las frases limitadas y limitar el número de frases en general son factores decisivos.

¿Alguna otra idea?

Respuestas (1)

¿Existe un servicio de transcripción de máquina en tiempo real (transmisión) que permita incluir scripts como material de capacitación para el reconocedor de voz?

Yawad Al Shaikh · Answer 1

Para el nivel de empresa comercial, verifique: HPE IDOL SpeechServer
Ref:
Guía de administración de HPE IDOL Speech Server 11.4.0 PDF Referencia de
HPE IDOL Speech Server 11.4.0

Para código abierto, creo que CMUSphinx es uno de los mejores:
https://cmusphinx.github.io/
https://github.com/cmusphinx
https://algorithmia.com/algorithms/sphinx/SpeechRecognition
https://sourceforge .net/projects/cmusphinx/

¿Existe un servicio de transcripción de máquina en tiempo real (transmisión) que permita incluir scripts como material de capacitación para el reconocedor de voz?

daniel newmann

Respuestas (1)

Yawad Al Shaikh

¿Existen bases de datos disponibles públicamente para la transcripción automática de música polifónica?

Mejora de la habilidad de transcripción de graves

¿Cómo notar un cambio en la sensación de tresillo a la mitad de una canción?

Sintonización de música para decodificador de notas

Herramienta para ayudar a "leer" partituras [cerrado]

¿Cómo puedo reformatear las matrices de peso de posición de mis motivos de ADN?

¿Cómo puedo reducir la velocidad de un video de YouTube que estoy tratando de analizar o transcribir?

Software de transcripción de entrevistas

¿Software transcriptor para Windows?

¿Existen herramientas de software gratuitas o baratas que transcriban una melodía o letra cantada?