Herramientas de análisis de audio CLI

¿Qué gráficos/imágenes pueden generarse a partir de archivos de audio? ¿Existe una utilidad de línea de comandos para generar dicha imagen?

Encontré lo siguiente:

Forma de onda: ffmpeg puede generar una forma de onda
Espectrograma: sox puede hacer un espectrograma

Cualquier herramienta CLI para análisis de audio también podría ser útil. Básicamente, cualquier cosa que me brinde más información que la duración, la tasa de bits, el formato, los canales, la frecuencia de muestreo, bit/muestra.

Mi sistema operativo es Windows 7. Se aceptan soluciones para otras plataformas. (solo precisa a qué se dirige la solución)

Respuestas (1)

Si bien no lo he probado yo mismo, pyAudioAnalysis para citar la propaganda:

pyAudioAnalysis es una biblioteca de Python que cubre una amplia gama de tareas de análisis de audio. A través de pyAudioAnalysis puede:

  • Extraiga características y representaciones de audio (por ejemplo, mfccs, espectrograma, cromagrama)
  • Clasificar sonidos desconocidos
  • Entrene, ajuste parámetros y evalúe clasificadores de segmentos de audio
  • Detecte eventos de audio y excluya períodos de silencio de grabaciones largas
  • Realizar segmentación supervisada (segmentación conjunta - clasificación)
  • Realizar segmentación no supervisada (p. ej., diarización del hablante)
  • Extraer miniaturas de audio
  • Entrene y use modelos de regresión de audio (aplicación de ejemplo: reconocimiento de emociones)
  • Aplicar reducción de dimensionalidad para visualizar datos de audio y similitudes de contenido
  • Operación de línea de comando, por ejemplo:
    • Extracción de cromagramas: python audioAnalysis.py fileChromagram -i data/doremi.wav.Ejemplo 1

Tenga en cuenta que hay muchas (446 en el momento de escribir este artículo) bifurcaciones de este código en github, algunas de las cuales pueden incluir modificaciones útiles.

Requisitos previos:

  • cliente de control de versiones de git (hay varios clientes disponibles para casi todas las plataformas) .
  • python (el código original es para python 2.7 pero al menos parte de esta bifurcación se ejecuta en python 3.3 o posterior).
  • Varios paquetes de python, que se ejecutan pip install numpy matplotlib scipy sklearn hmmlearn simplejson eyed3 pydubdespués de instalar python, deberían hacer el trabajo.

Se pueden encontrar ejemplos y tutoriales detallados en la wiki .

Esta opción es gratuita (gratis y de código abierto) y multiplataforma.

¡Limpio! Definitivamente lo investigaré.