Estoy ejecutando una aplicación Python 2.7 en Google App Engine y me gustaría convertir texto a voz, preferiblemente almacenando archivos mp3/mp4/wav en GAE. Todas las bibliotecas de Python que he visto tienen dependencias de C y, por lo tanto, no se pueden implementar en Google App Engine.
Google Translate hará el trabajo en línea, pero solo para un máximo de 100 caracteres, y no puedo encontrar ninguna biblioteca de Python pura para fusionar archivos de sonido (mis textos suelen ser mucho más largos que eso).
¿Existe una biblioteca o un servicio en línea que permita que mi aplicación sirva archivos de sonido creados a partir de textos? Por ahora, solo necesito TTS en inglés.
MaryTTS es un motor de texto a voz de Java, por lo que debería poder ejecutarlo en GAE u otros servicios similares.
Este ejemplo de python muestra cómo solicitarlo (ejecutándose como un servicio separado en la misma máquina) para procesar algún texto y regresar descargando un archivo .wav. Debería poder ejecutarlo en una instancia y su código python accediendo desde otra.
Hay muchas opciones, aquí se explica cómo guardar un hola mundo hablado usando diferentes bibliotecas:
Usando gTTS , la librería de texto a voz de Google:
import gtts
tts = tts.gTTS('hello world', lang='en')
tts.save('hello-world.mp3')
tts.save('hello-world.wav')
Usando una envoltura Sapi :
import tts.sapi
voice = tts.sapi.Sapi()
voice.say("Hello")
voice.set_voice("Anna")
voice.create_recording('output.wav', "This will be in a wav file")
pyTTSx permite TTS, pero aún no se ha desarrollado la compatibilidad para guardar la salida como un archivo
Mawg dice que reincorpore a Monica
I am running a Python 2.7 app
" <= ahí está tu problema , justo ahí.