¿Por qué las diferentes letras suenan diferente?

Si uno canta las letras "A" y "M" al mismo volumen y tono, las dos letras siguen siendo diferenciables. Sin embargo, si tanto el tono como el volumen son iguales, ¿no debería ser exactamente el mismo el sonido?

No puedes cantar la letra B, porque es una consonante oclusiva. Si te refieres a decir "abeja", como al sostener la vocal e, está en la fuerza relativa de los sobretonos.
¡Buen punto! No había pensado en eso.
Tal vez esta página de wikipedia ayude (se ocupa del caso de las vocales, por ejemplo, 'A' versus 'O').
La palabra que estás buscando es timbre .
@knzhou La letra B, de hecho, tiene voz y, por lo tanto, tiene tono.
De hecho, puede que no, no siempre. Considere el efecto McGurk ( video de ejemplo ).
Las letras no suenan a nada porque son meros símbolos escritos. Estás hablando de sonidos del habla (teléfonos). Esto no es quisquilloso. La forma en que se lee una carta depende del idioma, el habla/dialecto del lector, el contexto de la carta, etc.
@Szabolcs presumiblemente significa fonemas en lugar de teléfonos, pero también es una distinción muy importante.

Respuestas (4)

No cantas un solo tono, cantas una frecuencia y sus armónicos. Usando un analizador de espectro simple, este soy yo "cantando" las letras A y M, alternativamente (AMAMA, en realidad):

ingrese la descripción de la imagen aquí

La letra "A" es la que tiene más armónicos (líneas más brillantes a frecuencias más altas), la letra "M" parece tener un segundo armónico más grande. La escala de frecuencia no está calibrada correctamente (aplicación iPhone barata...)

Aquí hay otras dos tomas, una al lado de la otra (M, luego A). Puedes ver que el segundo armónico de la M es más grande que el primero; por el contrario, los armónicos más altos de A caen más lentamente:ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí

Las vocales simples tienen esto en común: la forma de tu boca cambia la intensidad relativa de los armónicos, y tu oído es bueno para captar eso. Por cierto, esta es la razón por la que a veces es difícil entender lo que canta una soprano: en la parte superior de su rango, las frecuencias que te ayudan a diferenciar las diferentes vocales pueden estar "fuera de rango" para tus oídos.

Para consonantes cortas ("explosivas") (P, T, B, K, etc.), la historia es un poco más complicada, ya que el contenido de frecuencia cambia durante el sonido de la letra. Pero luego es difícil "cantar" la letra P... podrías cantar "peeeee", pero luego es la "E" la que lleva el tono.

La aplicación que utilicé para esto es SignalSpy; no estoy afiliado a ella de ninguna manera.

espera un minuto... ¿tu tono base llega tan bajo como 15 hz? o la ecografía (primera imagen) tiene números incorrectos en la escala?
Por cierto, existe un software gratuito que también puede generar estas imágenes. Audacia por ejemplo.
@SargeBorsch, creo que los números de la escala logarítmica están desviados por un factor de 10 (dije "la escala de frecuencia no está calibrada correctamente"): vea las otras gráficas que tienen una frecuencia 10 veces mayor. Había oído hablar de Audacity pero no he intentado encontrarlo/usarlo.
@SargeBorsch pff, puedo cantar 15 Hz fácilmente
@Floris lo siento, no me di cuenta de esa parte
Técnicamente, los componentes espectrales de A y M también cambian durante el transcurso del canto y tienen otro contenido transitorio. La palabra musical para describir los diferentes sonidos de voces e instrumentos es timbre (pronunciado como "tamber").
@SargeBorsch Creo que Audacity es solo para escritorio, por lo que no se ejecutará en iPhone.
@Floris en realidad no es que la frecuencia no esté calibrada correctamente. Es solo que emites armónicos de baja frecuencia cuando hablas. Aquí está mi espectrograma de AMAM hecho en Audacity .
@Ruslan muy interesante, pero en ese caso hay algo diferente entre el rastro del "espectrograma" y el "analizador de espectro" que no puedo poner en mi buscador. ¿Quizás uno de ellos multiplica la amplitud por 1/f, haciendo que las frecuencias más bajas sean más visibles?
Sí, no noté la diferencia al principio. ¿Son estos análisis de la misma grabación (archivo)? ¿O uno de ellos fue capturado por la propia aplicación mientras otro analizaba un archivo guardado comprimido con pérdida (por ejemplo, mp3)?
Ambos fueron capturados y analizados por la misma aplicación, uno tras otro. No creo que haya cambiado el tono en tres octavas, por lo que sospecho que hay alguna diferencia en el procesamiento. Probaré con un generador de tonos puros...
@Ruslan Acabo de trimestre con un generador de señal. El espectro se ve bien, pero la escala vertical del espectrograma está completamente desactivada. Esto no es algo de "subarmónicos", solo una mala escala. Se lo haré saber al desarrollador.
@theonlygusti ¿Estás haciendo una broma? 15 Hz está casi una octava por debajo de la nota más baja del piano y es más bajo que el límite inferior del oído humano. Dudo que puedas cantar tan bajo, pero como nadie podría oírte de todos modos, ¡supongo que nadie puede decir que no puedes !
@pwf en realidad, la nota más baja jamás "cantada" es 0.189 Hz.
@theonlygusti: supongo que te refieres a este récord mundial Guinness . Sin embargo, según este artículo de NPR (que tiene una fecha posterior), la nota más baja que Tim Storm (el mismo tipo) ha "cantado" alguna vez para una grabación es la E baja - 41 Hz. Lo cual es muy bajo, pero mucho más creíble. Si digo "ja... ja... ja" una vez cada 10 segundos, "cantaría" 0,1 Hz según el equipo utilizado para la afirmación de 0,189 Hz...
@Floris, la nota más baja que cantó para una actuación fue la E baja. No creo que cantar "ja, ja, ja" cuente.

La frecuencia básica está determinada por las cuerdas vocales. Hacen que el flujo de aire lata con una frecuencia de 100 Hz a 200 Hz. Los pulsos son cortos, por lo que hay armónicos de hasta varios kHz.

La boca y la lengua hacen que el tracto vocal resuene en diferentes rangos de frecuencia. Esos se llaman formantes. Eche un vistazo al mapa de formantes aquí: https://www2.warwick.ac.uk/fac/sci/physics/staff/academic/bell/sonify/ttm/sound_files/

Aquí hay algo diferente a tener en cuenta. Digamos que le diría a una banda que toque la nota musical "C3". El bajo, la guitarra, el piano, la voz, el banjo, todos suenan diferentes y sin embargo los percibimos como la misma nota que se ha tocado.

De manera similar, piense en una "A" cantada y una "B" cantada (como en "abeja") como un instrumento respectivamente. Tienen su propio "sonido" único y, sin embargo, ambos pueden usarse para crear la misma "nota musical" de un determinado tono y volumen.

Entonces, ¿qué hace que una nota C3 de una "A" cantada sea diferente de una nota C3 de una "B" cantada? (¿O qué diferencia al C3 de un piano del C3 de una guitarra?)

Tenga en cuenta lo que realmente significa "mismo tono y volumen". Lo mantendré simple.

Tono: frecuencia percibida

Volumen: presión o amplitud del aire

Aquí hay dos imágenes para ilustrar lo que quiero decir:

ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí

Ambos tienen la misma amplitud o volumen.

Ambos tienen la misma frecuencia percibida o tono.

Así, ambos tocan la misma nota musical que percibimos.

Pero al mirar la forma de onda, probablemente podría decir que sonarán de manera diferente, aunque las percibamos como la misma nota.

Esta diferencia es similar a un piano C3 vs una guitarra C3.

Esencialmente: la misma frecuencia y presión de aire percibidas crean la ilusión de la misma nota musical percibida por un oyente. Se pueden percibir formas de onda (sonidos) completamente diferentes como la misma nota musical, siempre que su forma de onda "se vea igual" (las dos imágenes de arriba ilustran lo que quiero decir con eso).

Entonces, una "A" cantada y una "B" cantada son en realidad bastante diferentes entre sí. Pero si se cantan con el mismo tono, producirán el mismo sonido musical (tal como lo perciben los humanos).

Fuente de las imágenes utilizadas.

¡Gracias! Pensarlo desde una perspectiva instrumental lo hace mucho más claro.

Letras, sonidos físicos y los sonidos que escuchamos
Permítanme comentar primero que muchos idiomas (y especialmente el inglés) no tienen una correspondencia uno a uno con los sonidos. En otras palabras, las letras son símbolos, y algunas de ellas o grupos de letras pueden corresponder a varios sonidos, y el mismo sonido a veces puede representarse con diferentes (combinaciones de) letras.

Estudiar cómo se producen los diferentes sonidos se llama fonética . Tenga en cuenta que esto es diferente de la fonología , que estudia los sistemas de sonidos utilizados por idiomas particulares. Aunque todos los humanos, en principio, son capaces de producir y distinguir una gama similar de sonidos, muchos de ellos serán tratados como un solo sonido por un lenguaje específico ( alófonos ). A medida que el sistema de sonidos se aprende en la primera infancia, perdemos rápidamente la capacidad de diferenciar los sonidos que nuestro idioma nativo considera como uno.

(Mi experiencia personal es que las personas alfabetizadas a menudo ni siquiera escuchan los sonidos de su propio idioma, ya que su pensamiento se centra demasiado en cómo se escribe la palabra. Tratar de enseñarle a un extranjero su idioma lo descubre rápidamente).

Espectro de sonido
Al ser ondas acústicas, los sonidos se diferencian principalmente en su amplitud y espectro. Aparte de los idiomas tonales (como el chino), el volumen de un sonido generalmente indica acentuación, mientras que su tono (es decir, su posición relativa en la escala de frecuencia) no cambia el significado del sonido. Por lo tanto, las principales distinciones entre los sonidos tienen que ver con la forma de sus espectros , que se controla a través de la articulación .

Vocales
Es necesario distinguir vocales y consonantes. Las vocales son los sonidos que pueden sonar de forma continua; son esencialmente ondas de frecuencia modulada, similares a las que producen los instrumentos musicales de metal. Al igual que con los instrumentos musicales, la calidad de una vocal está controlada por la forma del resonador, que es nuestra cavidad bucal. Las vocales suelen ser por la posición de la lengua ( alta/baja y adelante/atrás ), por la posición de los labios ( redondos/no redondeados ) y por si la corriente de aire pasa por la nariz o no ( nasal y no).

Consonantes
Las consonantes se diferencian de las vocales por los movimientos asociados de los órganos del habla, por ejemplo, por la liberación repentina de aire ( consonantes oclusivas ), por las vibraciones rítmicas de la lengua (como las versiones de r en diferentes idiomas), etc. Su clasificación es más compleja que el de las vocales pero también bien asentado (ver el artículo de WIkipedia citado al principio). Por lo tanto, las consonantes se asocian con pulsos cortos o series de pulsos (a diferencia de las vocales que suenan continuamente).

Observación:

  • El sonido M continuo , como se sugiere en el OP, probablemente signifique el sonido continuo de una vocal nasal en lugar de M , que se forma por una liberación repentina de aire al abrir los labios.
  • Hago hincapié nuevamente en que la discusión anterior no se aplica a todos los idiomas, algunos de los cuales usan tono (como el chino) o incluso clics para transmitir información (algunos idiomas africanos). Sin embargo, la discusión se aplica a todos los idiomas indoeuropeos , como inglés, francés, ruso, persa, hindi y muchos otros; supongo que los lectores dominan al menos el inglés.