¿Por qué no puedes escuchar bien la música a través de una línea telefónica?
Me hicieron esta pregunta en una entrevista para unas prácticas universitarias y lamentablemente no tenía ni idea.
Me dieron la pista de que la frecuencia de muestreo del teléfono es de 8000 muestras por segundo.
La pista dada por el entrevistador es una pista falsa. La limitación que está escuchando ha sido parte de la red telefónica desde mucho antes de que el muestreo digital formara parte del sistema telefónico. Y se aplica incluso en una llamada telefónica local donde la señal nunca se digitaliza.
Está relacionado con el hecho de que la conexión desde un teléfono fijo en su casa u oficina hasta la "oficina central" de la compañía telefónica es esencialmente una conexión continua a través de un par de cables. Por lo general, no hay circuitos activos como amplificadores, repetidores, digitalizadores u otros componentes electrónicos involucrados.
Dada la tecnología de hace 100 años, cuando se diseñó por primera vez la red telefónica, una conexión de esta longitud realmente solo podía transportar un ancho de banda muy limitado. Los ingenieros que diseñaron la red realizaron numerosos experimentos para determinar exactamente qué frecuencias debían transmitirse para que las personas entendieran el habla regular de los demás, y diseñaron la red solo para asegurarse de que esas frecuencias se transmitieran. No agregaron ningún componente costoso al sistema si no eran necesarios para lograr este objetivo.
Por ejemplo, podrían haber usado filtros pasivos para "enfatizar" las altas frecuencias en circuitos que eran un poco más largos (y, por lo tanto, naturalmente, tienden a cortar las altas frecuencias) que el promedio, o para cortar las altas frecuencias en circuitos que eran más cortos que el promedio. para garantizar que todos los usuarios obtengan tanto como sea posible la misma calidad de conexiones.
Más tarde, cuando comenzaron a utilizar la multiplexación para conectar múltiples circuitos de voz a través de un solo cable (para conexiones entre ciudades, por ejemplo), el ancho de banda limitado les permitió transportar más conexiones en un solo cable, y en ese momento la limitación del ancho de banda habría se ha aplicado deliberadamente filtrando para garantizar que las conversaciones no se entrecrucen entre sí.
Finalmente, cuando el muestreo digital y la transmisión digital se introdujeron en la red, entraron en juego las limitaciones del teorema de muestreo discutidas en las otras respuestas. Afortunadamente, las limitaciones de ancho de banda introducidas en los primeros días de las redes telefónicas analógicas permitieron que la digitalización se realizara a tasas de bits realmente bajas sin degradar la calidad de la señal por debajo de lo que había sido todo el tiempo, y nuevamente esto permite que se realicen más conversaciones en un cable determinado en la red
Editar
Quiero resumir con un punto clave que publiqué anteriormente en un comentario sobre otra respuesta:
La frecuencia de muestreo digital (y, posteriormente, los métodos de compresión) utilizados en la telefonía digital se eligieron para que coincidieran con las características de la red telefónica analógica, y no al revés.
Según Wikipedia, el rango de frecuencia del servicio telefónico antiguo es de 300 Hz a 3,4 kHz. Por lo tanto, a cualquier música que escuche le faltarán las frecuencias bajas y las frecuencias altas. Si recuerda la última vez que escuchó música de espera en el teléfono, probablemente recordará que sonaba un poco apagado, pero debo decir que todavía es reconocible, es decir, puede identificar qué música se está reproduciendo. Me molestaría si mi Hi-Fi sonara así, pero la música no está totalmente destrozada.
En mi juventud, solía ser un entusiasta de la alta fidelidad, y las especificaciones técnicas de los fabricantes se jactaban de que sus equipos tenían un espectro de frecuencia plano de alrededor de 20 Hz a 20 kHz. El problema de reproducir esto en un sistema telefónico es que, como menciona DisplayName en su respuesta, para llevar una frecuencia a través de una red digital requiere una frecuencia de muestreo de al menos de lo contrario obtienes alias . Proporcionar ancho de banda cuesta dinero y reduce la capacidad de llamadas (es decir, menos llamadas por fibra óptica), por lo que las redes troncales telefónicas utilizan una frecuencia de muestreo de solo 8 kHz y, por lo tanto, la frecuencia máxima permitida es de 4 kHz. El límite superior es un poco más bajo porque es difícil diseñar filtros de audio con cortes muy agudos. El límite de 3,4 kHz que mencioné anteriormente es presumiblemente para garantizar que no pase ninguna frecuencia cercana a los 4 kHz.
Es discutible si se requiere un rango de frecuencia tan grande para la reproducción de música. En un chequeo auditivo reciente, me dijeron que no podía escuchar nada por encima de 12 kHz (demasiados conciertos de Black Sabbath en mi juventud), pero la música en mi Hi-Fi todavía me suena bien.
Echa un vistazo al teorema de Nyquist. La frecuencia de muestreo debe ser al menos el doble de la tasa de la frecuencia muestreada. Es decir, por eso el oído humano puede oír hasta ca. 20kHz y las muestras de CD a 44,1kHz.
Wikipedia Teorema de Nyquist-Shannon
¿Qué escuchamos en cambio si escuchamos (originalmente) música de 5 Hz a 20 kHz a través del teléfono? ¿Todo por encima de 8 kHz simplemente se ha ido o hay otro efecto? Por ejemplo, ¿se escucharán 14 kHz de alguna manera (pero de manera diferente) a 7 kHz?
O en otras palabras: "¿Qué está pasando con las frecuencias que están por encima del umbral de Nyquist?"
Faltan las frecuencias. Tan simple como eso. No presente. En cambio, lo que hace nuestro oído es recordar lo que debería estar allí, según la experiencia. Entonces, cuando hablas con alguien, sabes que por teléfono tu cerebro agrega lo que debe estar allí. Aún así, noté que la primera vez que hice esto, mi cerebro me dio la información real (falta de frecuencias) y solo más tarde aprendí que puede falsificar el resto, basado en el conocimiento de la voz del oponente. Consulte Wikipdedia:CELP , que utiliza un enfoque similar para la compresión de audio.
Si desea obtener más información sobre las razones de la frecuencia de muestreo de 8 kHz, puede volver a usar wikipedia: Wikipedia: PSTN , el estándar utilizado es G.711 . También Sampleing Frequency and Human Speech , que aún no he leído, explica lo que necesita como mínimo para el habla humana, incluidos gráficos y explicaciones. Finalmente, puede buscar en Wikipedia: MP3 para comprender la psicoacústica. Hint a beat enmascara las cosas que vienen después, por ejemplo. Para que esas cosas se puedan dejar caer, ya que no las escuchas y otras cosas bonitas. :D
Esto se debe al procesamiento de la señal, no a la física. Los operadores telefónicos aplican una compresión agresiva optimizada para grabar bien solo el habla. El códec AMR , todavía en uso, data de 1999 y alcanza hasta unos 13 kbit/s. Cualquier otro códec tampoco grabaría bien la música a esa tasa de bits. Incluso MIDI consume más datos.
Las compañías telefónicas solo construyeron el teléfono para transportar frecuencias de voz. Las frecuencias de graves y tweeters generalmente están fuera del rango para el que fueron construidos los teléfonos. Solía escuchar un programa de radio en el que cuando una persona llamaba con una broma tonta, jugaban grillos y cantaban a la persona en el teléfono. Les tomó mucho tiempo y varios momentos incómodos antes de darse cuenta de que la persona que llamaba por teléfono no podía escuchar a los grillos, pero los oyentes de la radio sí. Así que hicieron una prueba en el aire y conectaron grillos al teléfono y al teléfono para transmitir. Efectivamente, los grillos fueron bloqueados casi por completo por el sistema telefónico.
Hay algunas razones diferentes. Enfrentémonos sólo al canal digital.
Solo se utiliza una señal de banda limitada. G.711 utiliza una frecuencia de muestreo de 8 kHz, lo que da como resultado un ancho de banda utilizable de 4 kHz que queda para la voz. Está bien para la telefonía de voz, pero casi inutilizable para la música. Otros códecs usan diferentes anchos de banda, por ejemplo, G.722 (telefonía de banda ancha) usa una tasa de muestreo de 16 kHz, ancho de banda utilizable efectivo ~8 kHz. Esto suena mucho mejor.
Caso especial tiene lugar en los códecs de teléfonos móviles. Estos son los llamados códecs híbridos. Estos códecs están altamente optimizados para la transmisión de voz (los llamados códecs híbridos). Utiliza diferentes tipos de modelos del tracto vocal que están siendo excitados por una forma de señal muy reducida de su voz. Si te gustan estas cosas, busca: Baseband-RELP, GSM Fullrate Codec, CELP. Pero cuidado: esto es algo pesado.
Usando el teorema de Nyquist, los teléfonos solo transmitirán frecuencias que son la mitad de la tasa de muestreo llamada frecuencia de Nyquist correctamente; por lo tanto, con una frecuencia de muestreo de 8000 muestras por segundo, solo transmitirá correctamente sonidos con una frecuencia inferior a 4000 Hz.
La frecuencia fundamental (el tono que escuchas) de la voz humana está en el rango de 80 a 1100 Hz. Las frecuencias armónicas (frecuencias componentes con una frecuencia de un múltiplo entero de la frecuencia fundamental) de la voz humana pueden ser mucho más altas. Por lo tanto, una tasa de muestreo de 8000 muestras por segundo es suficiente para transmitir voces humanas sin muchos problemas (los armónicos aún pueden exceder la frecuencia de Nyquist).
Cuando se transmiten frecuencias por encima de la frecuencia de Nyquist, como en el caso de la transmisión de música , se produce un aliasing. Esto provoca distorsión. Esto se detalla en el siguiente diagrama.
La línea roja es la señal original. Los puntos azules representan las veces que se toman muestras de la señal original. La línea azul es la señal reconstruida por el oído a partir de la frecuencia de muestreo insuficiente. Como puede ver, se ha distorsionado de la señal roja y ahora tiene una frecuencia más baja; una frecuencia inferior a la frecuencia de Nyquist de la tasa de muestreo.
Escribí un código simple de Matlab para una experiencia de creación de alias.
ADVERTENCIA: Baje el volumen de los altavoces/auriculares justo antes de la ejecución.
% Aliasing in Matlab.
% http://physics.stackexchange.com/questions/104281/why-cant-you-hear-music-well-over-a-telephone-line
fs = 8000 % sampling rate (Hz)
nyquistfrequency = fs / 2 % Nyquist frequency (Hz)
freq = [1000;
2000;
3500; % ^ these frequencies will play fine
4500; % v these frequencies will experience aliasing and distort to a frequency lower than the Nyquist frequency
6000;
7000 ]; % frequencies (Hz)
duration = 1; % duration of signal
numberofsamples = ceil( duration * fs ); % number of samples
sample_times = (1 : numberofsamples) / fs;
[h w] = size(freq);
for i = 1 : h,
currentfrequency = freq(i) % current frequency
simplesound = sin( 2 * pi * currentfrequency * sample_times ); % create sound
wavplay( simplesound, fs ) % play sound
end;
Ingeniero2021
david z