¿Qué gráficos/imágenes pueden generarse a partir de archivos de audio? ¿Existe una utilidad de línea de comandos para generar dicha imagen?
Encontré lo siguiente:
Forma de onda: ffmpeg puede generar una forma de onda
Espectrograma: sox puede hacer un espectrograma
Cualquier herramienta CLI para análisis de audio también podría ser útil. Básicamente, cualquier cosa que me brinde más información que la duración, la tasa de bits, el formato, los canales, la frecuencia de muestreo, bit/muestra.
Mi sistema operativo es Windows 7. Se aceptan soluciones para otras plataformas. (solo precisa a qué se dirige la solución)
Si bien no lo he probado yo mismo, pyAudioAnalysis para citar la propaganda:
pyAudioAnalysis es una biblioteca de Python que cubre una amplia gama de tareas de análisis de audio. A través de pyAudioAnalysis puede:
Tenga en cuenta que hay muchas (446 en el momento de escribir este artículo) bifurcaciones de este código en github, algunas de las cuales pueden incluir modificaciones útiles.
Requisitos previos:
pip install numpy matplotlib scipy sklearn hmmlearn simplejson eyed3 pydub
después de instalar python, deberían hacer el trabajo.Se pueden encontrar ejemplos y tutoriales detallados en la wiki .
Esta opción es gratuita (gratis y de código abierto) y multiplataforma.
elRowdy