¿Cómo se pueden distinguir los instrumentos por sus características tímbricas?

Lo que estoy tratando de lograr es distinguir los instrumentos por su timbre. Lo que he leído hasta ahora me hizo pensar que diferentes instrumentos tienen diferente número de armónicos.

¿Es posible identificar un instrumento a partir de una lista de sobretonos/armónicos para cada (o al menos algunos) instrumento representado como, por ejemplo, frecuencias? ¿O depende del estado físico de un instrumento?

¿O voy en una dirección completamente equivocada y el timbre no se forma, entre otros, con la cantidad de sobretonos?

Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .
Relacionado: Es bastante difícil ir solo por timbre de oído, dependemos mucho del ataque y decaimiento de un instrumento youtube.com/watch?v=thD6TNUoyIk
@ViktorMellgren, la mejor respuesta la dio Todd Wilcox. Lo explicó de una manera más detallada que Andrew Huang.

Respuestas (3)

Una simple lista de los armónicos presentes no le diría mucho. Lo que realmente quieres son los niveles/intensidad relativos de cada sobretono. Una lista de armónicos con intensidades relativas para un instrumento se denomina espectro del instrumento . Puede intentar buscar "espectro" para los que más le interesen. Aquí hay un ejemplo para un violín:ingrese la descripción de la imagen aquí

Muchos instrumentos tienen virtualmente exactamente los mismos armónicos presentes y, a menudo, con amplitudes relativas muy similares. Lo que los diferencia son las amplitudes relativas a lo largo del tiempo . El cambio en la amplitud de un sobretono a lo largo del tiempo es su envolvente de tiempo . Las envolventes de tiempo combinadas de los diferentes armónicos (lo llamaremos simplemente "envolvente" por simplicidad) también es un aspecto crítico del reconocimiento de instrumentos.

Los armónicos que son relativamente estables durante un cierto período de tiempo se denominan parciales . Los sobretonos que solo son audibles durante cortos períodos de tiempo se denominan transitorios , y los transitorios iniciales son importantes para el reconocimiento de instrumentos.

Los aspectos importantes del reconocimiento del timbre de un instrumento tonal son la envolvente y el espectro completo de armónicos, incluidos los parciales y los transitorios.

Tenga en cuenta que los componentes menores del sonido de un instrumento (incluidos los ruidos , como el ruido de la respiración) también se representan en el espectro, principalmente como transitorios.

Tenga en cuenta también que los instrumentos sin tono, como muchos instrumentos de percusión (p. ej., platillos) o instrumentos más "ruidosos" tienen múltiples frecuencias presentes que no están armónicamente relacionadas y, a veces, se denominan componentes inarmónicos . Las frecuencias y amplitudes de estos armónicos menos o no relacionados crean el espectro para un sonido sin tono y también determina si un sonido tiene un poco de tono (como un tambor). Las envolventes y los transitorios también son igual de importantes para el reconocimiento de instrumentos sin tono.

Como dices, los transitorios iniciales son una parte realmente importante del timbre percibido, y estos a menudo tienen características enarmónicas/ruidosas. Solo una revisión rápida de la terminología: ¿no pensé que 'parcial' implicaba una falta de relación armónica a menos que especificara 'parcial enarmónico'? por ejemplo, consulte la tabla en en.wikipedia.org/wiki/Overtone#Musical_usage_term
La definición precisa de parcial es un componente de una señal que es periódica y estable y que se puede modelar como una sinusoide que varía lentamente en el tiempo. Los parciales pueden ser armónicos o inarmónicos. Un espectro de frecuencia está formado por parciales (tanto armónicos como inarmónicos) y transitorios.
@joseem "Formant" se usa con el mismo significado al analizar el sonido de los instrumentos musicales, para describir la forma en que las resonancias del instrumento en sí (que son independientes del tono de la nota que se toca) afectan las amplitudes de diferentes armónicos. Por ejemplo, la existencia de formantes explica por qué algunos instrumentos tienen cualidades tonales muy diferentes en sus registros agudos y graves. Consulte music.columbia.edu/cmc/MusicAndComputers/chapter4/04_04.php, por ejemplo.
Artículo bastante interesante @alephzero, a primera vista, estoy de acuerdo en que limitar la aplicación del concepto de formantes solo a los sonidos de voz (la aplicación original del concepto) es demasiado restrictivo. Aún así, es importante tener en cuenta que los formantes no son el espectro, sino solo ciertas frecuencias específicas (resonancia, como usted dice).

Para los oídos humanos, la relación entre el sobretono y la fundamental quizás no sea tan importante como el área de tono en la que suena el sobretono. Nuestros oídos han evolucionado para detectar picos y valles de resonancia (consulte el concepto de formantes vocales ) que son pertinentes para distinguir las vocales. Un sonido "ah", por ejemplo, tiene una cualidad "ah" independientemente del tono fundamental utilizado al hablar o el rango específico de los sobretonos que se encuentran dentro de las áreas formantes.

Los instrumentos tienen perfiles de onda característicos basados ​​en cómo se forman los sonidos: por ejemplo, un clarinete al menos comenzará con solo armónicos impares, una cuerda producirá una onda de sonido con cualidades de onda de diente de sierra a medida que la cuerda se desliza y es agarrada por el arco. , un instrumento de metal tendrá algunas cualidades de onda de pulso a medida que el aire se fuerza periódicamente a través de los labios. Pero lo que más distingue a estos instrumentos entre sí son los picos y valles resonantes que surgen de la forma o la construcción, que son invariantes independientemente del tono que se toque. El sonido es el resultado de la combinación del "excitador" y el "resonador" para las vibraciones de la fuente, similar al modelo de fuente/filtro utilizado para el reconocimiento y la síntesis del habla.

Y sí, también hay características de envolvente, especialmente relacionadas con el comienzo de las notas que pueden ayudarnos a distinguir diferentes sonidos.

Ahora existe una tecnología increíble que puede seleccionar instrumentos de una mezcla. Solo estoy compartiendo un poco de lo que sé de la teoría acústica. Todavía no he aprendido cómo hacer el análisis para identificar rápidamente el perfil armónico. Finalmente aprendí las matemáticas básicas detrás del análisis DFT, a través de la Guía del científico e ingeniero para el procesamiento de señales digitales , pero creo que pasará mucho tiempo antes de aprender la programación y las matemáticas para identificar verdaderamente los instrumentos.

En un enfoque práctico/de ingeniería, una vez que tenemos el análisis espectral (es decir, la caracterización del espectro de frecuencia a lo largo del tiempo en términos de transitorios y parciales armónicos e inarmónicos, como se explica en la respuesta de Todd Wilcox), necesitamos comparar nuestro instrumento con un base de datos de referencia de instrumentos previamente catalogados.

Esto se hace utilizando una cantidad bastante grande de propiedades espectrales evaluadas a partir del espectro básico, por ejemplo, solo por nombrar algunas (hay docenas):

  • contraste espectral - una comparación de la envolvente espectral con la base de datos de referencia
  • inarmonicidad - peso relativo de los componentes inarmónicos
  • disonancia - comparación de la envolvente espectral con una referencia de disonancia perceptual

La comparación de la base de datos se realiza por medios estadísticos, ya que, por supuesto, no hay dos muestras del mismo tipo de instrumento (o incluso del mismo instrumento exacto) que sean exactamente iguales.

Normalmente se utilizan algoritmos de agrupamiento: varias muestras del mismo tipo de instrumento se clasifican en un "grupo" en la base de datos. Luego, la muestra que se analiza se compara con cada grupo, para encontrar dónde encaja mejor. Aquí hay un ejemplo del resultado de dicho proceso (el proceso debe repetirse para varias combinaciones de diferentes parámetros para obtener buenos resultados de coincidencia):ingrese la descripción de la imagen aquí

Esta imagen se obtuvo con sms-tools (un conjunto de recursos desarrollado por la universidad Pompeu Fabra en Barcelona), Essentia (una herramienta de software muy potente para el análisis de audio) y colecciones de muestras recopiladas de Freesound . Estos son recursos invaluables para cualquiera que se esfuerce en un análisis sólido.