¿Qué tiene más matices: vocales o consonantes?

Al comparar los patrones de frecuencia (por ejemplo, usando un FFTSCOPE) para los sonidos de las vocales habladas y de las consonantes, algunos de nosotros encontramos que los sonidos de las vocales tenían más matices (es decir, una mayor cantidad de picos en el espectro de potencia) que las consonantes, mientras que otros encontraron lo contrario. ¿Existe una respuesta correcta para esta pregunta o depende de la forma de pronunciarla de cada individuo?

Respuestas (3)

Las consonantes son principalmente solo ruido, frecuencias en gran parte altas y semialeatorias. Las vocales son generalmente la única parte del discurso que tiene contenido armónico en oposición al contenido inarmónico de las consonantes. Las vocales directas brillantes como EEEEEE tienen muchos más matices que las vocales posteriores oscuras como AHHHHHH. La mayoría de las consonantes, excepto las nasales, son tan breves que me sorprendería si se pudiera ver algún contenido de armónicos que se relacione solo con ellas; los armónicos seguramente provendrían en su mayoría de las vocales anteriores y posteriores. Una vez más, las nasales como mmmmm y nnnnnn son una excepción importante, y esperaría un contenido armónico bastante fuerte de ellas.

De lo contrario, las fricativas y especialmente las oclusivas sibilantes deberían causar breves ráfagas de explosiones de alta frecuencia más o menos aleatorias que pueden parecer "más armónicos", pero en realidad son solo ruido.

De acuerdo con Pat aquí, solo quiero aclarar que sus comentarios probablemente sean específicos de los lenguajes románticos. Otros idiomas, como el mandarín, el cantonés o el japonés, suenan de manera muy diferente y, como tales, deben tratarse de manera diferente.
Bueno, sé que lo que dije se aplica a mucho más que solo las lenguas romances, porque es cierto para el inglés y el alemán, de hecho, para todos los idiomas europeos con los que estoy familiarizado. Creo que lo que he dicho es bastante universal, obviamente, las consonantes y las vocales que se usan varían sustancialmente, y las proporciones relativas de ellas serán muy diferentes, pero la naturaleza real de las consonantes frente a las vocales debería ser la misma. Si su punto es que la naturaleza tonal de esos idiomas los hace diferentes, entonces eso es cierto, pero solo las vocales y las nasales pueden llevar tono, por lo que sigue siendo similar.

Depende de tu forma de cuantificar las cosas. El habla normal convierte el flujo de aire en energía de manera algo eficiente, por lo que tiene cantidades similares de energía por vez. Las consonantes se dividen en varias clases diferentes, sonoras y sordas, ortogonalmente nasales, fricativas y oclusivas.

Las vocales se dirigen bastante bien, por lo que tienden a llevarse mejor que la mayoría de las consonantes en la dirección del habla. Particularmente si están bien sostenidos con una laringe baja relajada. Los componentes sordos de las fricativas y las oclusivas se encuentran básicamente en todo el espectro, con las fricativas que tienen una fase aleatoria (distribuyendo la energía uniformemente a lo largo del tiempo) y las oclusivas con una fase lineal (enfocando una gran cantidad de energía en un punto del tiempo). Las vocales tienen un espectro de líneas, siendo la primera línea la frecuencia fundamental y las líneas adicionales formadas a partir de los armónicos por el tracto vocálico. Las líneas obviamente tienen picos más altos que los sonidos sordos de amplio espectro. Hay más armónicos para comenzar antes de dar forma cuando hay un buen cierre vocal y/o participación de la voz del pecho.

Para empezar, los registros de flauta/falsetto son débiles en armónicos para los formantes, y el tracto vocálico es más apto para dar forma a los armónicos en tonos más bajos, por lo que las vocales se vuelven difíciles de distinguir en esos registros.

En escenarios operísticos, las consonantes tienden a perderse, en parte debido a su peor directividad, en parte porque las fricativas en particular tienen un volumen limitado y las oclusivas necesitan una exageración más consciente que las vocales. He sido testigo de un "Siegfried" estadounidense que básicamente solo hablaba vocales. Totalmente molesto.

Por lo tanto, depende en gran medida de las ventanas de frecuencia y tiempo que esté considerando determinar dónde está disponible/enfocada la mayor parte de la energía.

Respuesta corta:

Consonantes en su mayoría

Respuesta larga:

El punto importante aquí es menos la definición de vocal/consonante, pero más el sonido fonético que representan. E por ejemplo puede ser de eeeeeexample, o seeeee, que tienen un conjunto diferente de sobretonos

las consonantes trabajan para puntuar las vocales y dar forma al idioma porque en su mayoría son breves explosiones de densidad. Por lo general, tienen más matices en un corto espacio de tiempo, lo que le permite a su mente captarlos.

En su forma más simple, tiene sonidos de vocales abiertas como AAAAAAAh, EEEEE, etc.

entonces tienes nasales en el medio, como mmmm o nnnnn

Creo que un sonido que no se puede sostener se llama oclusivo. Entonces T por ejemplo

Tomé una grabación de espectrómetro de un sonido T (como en el tictac) contra un sonido E (como en el habla) y descubrí que el sonido T tenía muchos, muchos más armónicos empaquetados en un espacio pequeño. (Pondré la imagen en un momento)

Piense en ello como un cantante de ópera golpeando una nota larga y sostenida (digamos e) frente a un tambor. El Snare Drum es una ráfaga corta y aguda de sonido como una oclusiva, pero penetra el sonido largo porque hay muchos armónicos golpeando en una ráfaga corta.

Luego tienes los sonidos raros como (Mira)ge, o la ch en Loch.

Espero que ayude :)

Solo un caso en esta publicación. ¿Todavía tienes, o puedes recrear, las imágenes del espectrómetro? Serían muy interesantes de ver.