¿Cómo distinguir las voces femeninas y masculinas a través del análisis de Fourier?

¿Qué hace que uno, sin mirar, sea capaz de identificar el género del hablante como masculino o femenino?

Quiero decir, si Fourier analizó la voz de hombres y mujeres, ¿en qué se diferencian los 2 espectros que explican esa distinción en los sonidos?

¿Es este un tema para nosotros? Definitivamente puedo ver una pregunta sobre las razones físicas por las que estas diferencias están en el tema aquí, pero no estoy seguro de preguntar simplemente cuál es la diferencia. Si esto está fuera de tema aquí, podría migrarse a Signal Processing .
@DavidZaslavsky Es una pregunta de física general, que surgió en un curso de física matemática. No soy un experto, por lo tanto, no tiene sentido preguntar esto en una rama de stackexchange completamente separada.
Posibles duplicados: physics.stackexchange.com/q/15385/2451 y enlace allí.

Respuestas (2)

Esto ha sido ampliamente estudiado en lingüística y acústica. Los humanos y otros primates predicen el género del hablante a través de una combinación de frecuencia fundamental F 0 ("tono") y estimaciones Vocal-Tract-Length ( V T L ) que son un indicador del tamaño del cuerpo.

A veces se utiliza la "dispersión de formantes" para V T L . Suele definirse como

i = 1 norte ( F i + 1 F i ) norte 1
dónde F i es el i la frecuencia del formante y norte es el número de formantes medidos. Sin embargo, esta medida es problemática y no captura información sobre los formantes de rango medio o sobre el posicionamiento de los formantes. Vea Las voces masculinas señalan el potencial de amenaza de los hombres en las sociedades industriales y de recolectores.

Una alternativa V T L medida es 'posición formante', definida como:

i = 1 norte F i norte
dónde F i es el i th formante estandarizado en toda la población medida.

Sin embargo, el hallazgo habitual es que una combinación de tono y estimaciones de la longitud del tracto vocal nos dan información sobre el género del hablante y la madurez sexual. Al observar los espectros de hombres y mujeres, en promedio, vería voces masculinas de tono más bajo y formantes más espaciados.

Los correlatos acústicos del sexo del hablante y la identidad del hablante individual están presentes en un segmento de vocal corta producido en el habla corriente

Percepción de la longitud del tracto vocal y la evolución del lenguaje

La longitud del tracto vocal y la dispersión de la frecuencia de los formantes se correlacionan con el tamaño corporal en los macacos rhesus , pero consulte Frecuencias de los formantes y tamaño corporal del hablante: una relación débil en humanos adultos

¿Pueden los análisis espectrales de la voz diagnosticar problemas y enfermedades vocales? Estoy familiarizado con la serie de Fourier y la transformada de Fourier en general, lamentablemente no estoy familiarizado con la "dispersión de formato"
" Dispersión de formantes " es un término técnico en el campo de la acústica/lingüística auditiva. Los formantes son un concepto clave allí. Los formantes son los picos espectrales del sonido de la voz, consulte en.wikipedia.org/wiki/Formant . En lingüística se utilizan para caracterizar y distinguir vocales y otros sonidos continuos y para analizar consonantes por su impacto en formantes adyacentes.
Sí, también se utilizan ampliamente para detectar disfunciones vocales. ¡ una búsqueda en Google de "disfunción vocal de formantes" es bastante reveladora!
Tenga en cuenta que el oído humano funciona por medio de lo que es esencialmente un análisis espectral realizado mecánicamente a través de algo así como una transformada continua de ondículas. Hice un artículo sobre esto para neurolingüística una vez :)
Gran información. Muchas gracias. Si quiero buscar qué tipo de investigación se realiza en este campo o campos relacionados, ¿qué palabras clave debo usar?

Mi impresión sería que las frecuencias más bajas son más evidentes en el espectro masculino que en el femenino.

Si desea construir una buena prueba, mi enfoque sería determinar un espectro masculino promedio y femenino promedio. Luego puede ver cuál de su espectro promedio o más común se correlaciona mejor con la persona de prueba.

Sin embargo, debe tener en cuenta el ruido en los espectros medidos.

Es posible que desee investigar si el hecho de que generalmente pueda identificar cuando una voz es masculina hablando en falsete puede explicarse por algunas diferencias particulares del espectro de una hablante femenina.