Lo que estoy tratando de lograr es distinguir los instrumentos por su timbre. Lo que he leído hasta ahora me hizo pensar que diferentes instrumentos tienen diferente número de armónicos.
¿Es posible identificar un instrumento a partir de una lista de sobretonos/armónicos para cada (o al menos algunos) instrumento representado como, por ejemplo, frecuencias? ¿O depende del estado físico de un instrumento?
¿O voy en una dirección completamente equivocada y el timbre no se forma, entre otros, con la cantidad de sobretonos?
Una simple lista de los armónicos presentes no le diría mucho. Lo que realmente quieres son los niveles/intensidad relativos de cada sobretono. Una lista de armónicos con intensidades relativas para un instrumento se denomina espectro del instrumento . Puede intentar buscar "espectro" para los que más le interesen. Aquí hay un ejemplo para un violín:
Muchos instrumentos tienen virtualmente exactamente los mismos armónicos presentes y, a menudo, con amplitudes relativas muy similares. Lo que los diferencia son las amplitudes relativas a lo largo del tiempo . El cambio en la amplitud de un sobretono a lo largo del tiempo es su envolvente de tiempo . Las envolventes de tiempo combinadas de los diferentes armónicos (lo llamaremos simplemente "envolvente" por simplicidad) también es un aspecto crítico del reconocimiento de instrumentos.
Los armónicos que son relativamente estables durante un cierto período de tiempo se denominan parciales . Los sobretonos que solo son audibles durante cortos períodos de tiempo se denominan transitorios , y los transitorios iniciales son importantes para el reconocimiento de instrumentos.
Los aspectos importantes del reconocimiento del timbre de un instrumento tonal son la envolvente y el espectro completo de armónicos, incluidos los parciales y los transitorios.
Tenga en cuenta que los componentes menores del sonido de un instrumento (incluidos los ruidos , como el ruido de la respiración) también se representan en el espectro, principalmente como transitorios.
Tenga en cuenta también que los instrumentos sin tono, como muchos instrumentos de percusión (p. ej., platillos) o instrumentos más "ruidosos" tienen múltiples frecuencias presentes que no están armónicamente relacionadas y, a veces, se denominan componentes inarmónicos . Las frecuencias y amplitudes de estos armónicos menos o no relacionados crean el espectro para un sonido sin tono y también determina si un sonido tiene un poco de tono (como un tambor). Las envolventes y los transitorios también son igual de importantes para el reconocimiento de instrumentos sin tono.
Para los oídos humanos, la relación entre el sobretono y la fundamental quizás no sea tan importante como el área de tono en la que suena el sobretono. Nuestros oídos han evolucionado para detectar picos y valles de resonancia (consulte el concepto de formantes vocales ) que son pertinentes para distinguir las vocales. Un sonido "ah", por ejemplo, tiene una cualidad "ah" independientemente del tono fundamental utilizado al hablar o el rango específico de los sobretonos que se encuentran dentro de las áreas formantes.
Los instrumentos tienen perfiles de onda característicos basados en cómo se forman los sonidos: por ejemplo, un clarinete al menos comenzará con solo armónicos impares, una cuerda producirá una onda de sonido con cualidades de onda de diente de sierra a medida que la cuerda se desliza y es agarrada por el arco. , un instrumento de metal tendrá algunas cualidades de onda de pulso a medida que el aire se fuerza periódicamente a través de los labios. Pero lo que más distingue a estos instrumentos entre sí son los picos y valles resonantes que surgen de la forma o la construcción, que son invariantes independientemente del tono que se toque. El sonido es el resultado de la combinación del "excitador" y el "resonador" para las vibraciones de la fuente, similar al modelo de fuente/filtro utilizado para el reconocimiento y la síntesis del habla.
Y sí, también hay características de envolvente, especialmente relacionadas con el comienzo de las notas que pueden ayudarnos a distinguir diferentes sonidos.
Ahora existe una tecnología increíble que puede seleccionar instrumentos de una mezcla. Solo estoy compartiendo un poco de lo que sé de la teoría acústica. Todavía no he aprendido cómo hacer el análisis para identificar rápidamente el perfil armónico. Finalmente aprendí las matemáticas básicas detrás del análisis DFT, a través de la Guía del científico e ingeniero para el procesamiento de señales digitales , pero creo que pasará mucho tiempo antes de aprender la programación y las matemáticas para identificar verdaderamente los instrumentos.
En un enfoque práctico/de ingeniería, una vez que tenemos el análisis espectral (es decir, la caracterización del espectro de frecuencia a lo largo del tiempo en términos de transitorios y parciales armónicos e inarmónicos, como se explica en la respuesta de Todd Wilcox), necesitamos comparar nuestro instrumento con un base de datos de referencia de instrumentos previamente catalogados.
Esto se hace utilizando una cantidad bastante grande de propiedades espectrales evaluadas a partir del espectro básico, por ejemplo, solo por nombrar algunas (hay docenas):
La comparación de la base de datos se realiza por medios estadísticos, ya que, por supuesto, no hay dos muestras del mismo tipo de instrumento (o incluso del mismo instrumento exacto) que sean exactamente iguales.
Normalmente se utilizan algoritmos de agrupamiento: varias muestras del mismo tipo de instrumento se clasifican en un "grupo" en la base de datos. Luego, la muestra que se analiza se compara con cada grupo, para encontrar dónde encaja mejor. Aquí hay un ejemplo del resultado de dicho proceso (el proceso debe repetirse para varias combinaciones de diferentes parámetros para obtener buenos resultados de coincidencia):
Esta imagen se obtuvo con sms-tools (un conjunto de recursos desarrollado por la universidad Pompeu Fabra en Barcelona), Essentia (una herramienta de software muy potente para el análisis de audio) y colecciones de muestras recopiladas de Freesound . Estos son recursos invaluables para cualquiera que se esfuerce en un análisis sólido.
usuario28
dave
Viktor Mellgren
Юрій Кравець