¿Por qué más ancho de banda significa una tasa de bits más alta en la transmisión digital?

Entiendo que se han hecho preguntas similares a esta anteriormente en este sitio, que se enumeran a continuación. Sin embargo, estoy confundido acerca de las respuestas. Si explico lo que creo que entiendo, ¿alguien puede señalar dónde me equivoco?

Empiezo con lo que sé:

La ley de Shannon da el límite superior teórico

C norte o i s y = B yo o gramo 2 ( 1 + S norte )

si S = N, entonces C = B

Como N→∞, C→0

Como N→0, C→∞

Nyquist Formula dice aproximadamente cuántos niveles se necesitan para alcanzar este límite

C norte o i s mi yo mi s s = 2 B yo o gramo 2 METRO

(Si no usa suficientes niveles lógicos, no puede acercarse al límite de shannon, pero al usar más y más niveles, no excederá el límite de shannon)


Mi problema es que me cuesta entender por qué el ancho de banda se relaciona con la tasa de bits. A mí me parece que el límite superior de la frecuencia que se puede enviar por el canal es el factor importante.

Aquí hay un ejemplo muy simplificado: sin ruido, 2 niveles lógicos (0V y 5V), sin modulación y un ancho de banda de 300 Hz (30 Hz - 330 Hz). Tendrá un límite de Shannon de ∞ y un límite de Nyquist de 600bps. Suponga también que el canal es un filtro perfecto, por lo que cualquier cosa fuera del ancho de banda se disipa por completo. A medida que duplico el ancho de banda, duplico la tasa de bits, etc.

Pero ¿por qué es esto? Para transmisión digital de dos niveles Con un ancho de banda de 300 Hz (30 Hz - 330 Hz), la señal digital de "0V" y "5V" será una onda cuadrada (aproximadamente). Esta onda cuadrada tendrá los armónicos por debajo de 30 Hz y por encima de 330 Hz disipados, por lo que no será perfectamente cuadrada. Si tiene una frecuencia fundamental de 30 Hz como mínimo (por lo que los "0V" y los "5V" están cambiando 30 veces por segundo), entonces habrá una buena cantidad de armónicos y una buena onda cuadrada. Si tiene una frecuencia fundamental de 330 Hz como máximo, la señal será una onda sinusoidal pura ya que no hay armónicos de orden superior para hacerla cuadrada. Sin embargo, como no hay ruido, el receptor aún podrá discriminar los ceros de los unos. En el primer caso la tasa de bits será de 60 bps, como los "0V's" y los "5V" están cambiando 30 veces por segundo. En el segundo caso, la tasa de bits será como máximo de 660 bps (si el umbral de tensión de conmutación del receptor es exactamente de 2,5 V), y ligeramente inferior si el umbral de tensión es diferente.

Sin embargo, esto difiere de la respuesta esperada de 600 bps para el límite superior. En mi explicación, lo que importa es el límite superior de la frecuencia del canal, no la diferencia entre el límite superior e inferior (ancho de banda). ¿Puede alguien por favor explicar lo que he entendido mal?

Además, cuando mi lógica se aplica al mismo ejemplo pero usando modulación FSK (modulación por cambio de frecuencia), tengo el mismo problema.

Si un cero se expresa como una frecuencia portadora de 30 Hz, un uno se expresa como una frecuencia portadora de 330 Hz y la señal de modulación es de 330 Hz, entonces la tasa de bits máxima es de 660 bps.

Una vez más, ¿alguien puede aclarar mi malentendido?

Además, ¿por qué usar una onda cuadrada en primer lugar? ¿Por qué no podemos simplemente enviar ondas sinusoidales y diseñar los receptores para que tengan un voltaje de umbral de conmutación exactamente en el medio entre el valor máximo y mínimo de la onda sinusoidal? De esta forma la señal ocuparía mucho menos ancho de banda.

¡Gracias por leer!

Disculpas por el formato muy pobre, no hice una vista previa antes de publicar. He arreglado esto ahora.
@Ignacio Vazquez-Abrams, oh bueno, eso me sorprende; Supuse que simplificaría mi ejemplo. Sin embargo, 5 armónicos generalmente dan una onda cuadrada bastante decente, entonces, ¿por qué necesitaría frecuencias fuera del ancho de banda para evitar la distorsión?
En lugar de pensar en lo que sucede con una banda de paso de 30-300 Hz, imagine lo que sucedería si su banda de paso fuera de 1,0 a 1,3 kHz, por ejemplo.
@ThePhoton: Supongo que en este caso no podrá tener armónicos de orden superior, porque cuando la frecuencia fundamental es 1kHz, el primer armónico es 3KHz, que está muy por fuera de la banda de paso. Pero esto todavía me deja confundido. ¿Cuál sería el daño en solo transmitir la frecuencia fundamental?
primero algo de terminología. La fundamental es lo mismo que el primer armónico. Si la fundamental es 1 kHz, entonces 3 kHz es el tercer armónico.
A continuación, solo transmitir el fundamental (o portador) no transmite información. Para llevar información tienes que modular el portador de alguna manera. Si comienza a encender y apagar una portadora, el espectro ya no es solo una línea estrecha, sino que se extiende según cómo lo module. Si tiene una banda de paso entre 1,0 y 1,3 kHz, solo podrá modular su portador con una señal de información de aproximadamente 300 Hz, y solo podrá usarla para transmitir información a la velocidad determinada por la SNR. y la fórmula de Shannon-Nyquist.
@ThePhoton: Gracias por su respuesta. Sin embargo, ¿no serán los 3 KHz el segundo armónico entonces, como una onda cuadrada, son múltiplos impares de la fundamental? enlace (use el cuadro de zoom para ver la ola).
no, todavía lo llamamos el 3er armónico. El n-ésimo armónico está en n veces la frecuencia fundamental. Simplemente decimos "no hay un segundo armónico presente en una onda cuadrada ideal".
En realidad es al revés. Una tasa de bits más alta significa más ancho de banda.

Respuestas (3)

Es un punto sutil, pero su pensamiento se desvía cuando piensa en un tono de 330 Hz como algo que transmite 660 bits/segundo de información. No lo hace, y de hecho, un tono puro no transmite ninguna información más que su presencia o ausencia.

Para transmitir información a través de un canal, debe poder especificar una secuencia arbitraria de estados de señalización que se transmitirán y, este es el punto clave, poder distinguir esos estados en el otro extremo.

Con su canal de 30-330 Hz, puede especificar 660 estados por segundo, pero resultará que el 9% de esas secuencias de estado violarán las limitaciones de ancho de banda del canal y serán indistinguibles de otras secuencias de estado en el otro extremo, por lo que no puedes usarlos. Es por esto que el ancho de banda de la información resulta ser de 600 b/s.

En realidad, al enviar solo 30 símbolos de 2 estados por segundo, la tasa de datos es de 30 bps. Nyquist nos informa sobre el límite superior de velocidad de datos dado un ancho de banda y una cantidad de estados por símbolo. La codificación FSK elegida no se acerca a este límite ya que las frecuencias elegidas no son óptimas. Nyquist dice que podemos elegir mejores frecuencias.
@le_top: Para que quede claro, no estaba hablando de la modulación FSK, aunque el OP lo mencionó en su pregunta. Estoy hablando de señalización de banda base directa (por ejemplo, dos niveles de voltaje). No creo que nada de lo que escribí mereciera un voto negativo. ¿Puedes explicar qué crees que está mal con lo que escribí?
* La presencia o ausencia del tono de 330 Hz transmite información ya que su presencia puede interpretarse como un 1 y su ausencia como un 0. La modulación está activada/desactivada. * Entonces, los 330 Hz podrían transmitir información de 660 bps en ausencia del tono de 30 Hz. Lo que sería ruido en la fórmula de Shannon. * La confusión aún existía después de leer esto. * No se explica que la pérdida del 9% se explica por el teorema de muestreo de Nyquist que indica que la señal se reconstruye perfectamente a partir de precisamente 2B muestras por segundo.
* Si intenta hacer más, tiene efectos de aliasing, por lo tanto, la limitación de símbolos 2B es igual al número de muestras. * 2B símbolos de cada 1 bit (2 estados) son 600bps con B=300. * Son posibles 660 estados si los símbolos representan al menos 2,2 estados.
@le_top: Realmente no entiendo a dónde vas con esto. No hemos estado hablando de sistemas muestreados (de tiempo discreto) en absoluto, por lo que la cuestión del aliasing nunca surge. ¿Cuál es su punto en relación con la pregunta en cuestión?
La pregunta es sobre la fórmula de Nyquist ( Cnoiseless=2∗B∗log2M ). Se basa en el hecho de que una señal con ancho de banda B puede reconstruirse completamente a partir de 2B muestras. Esto conduce a la tasa máxima de símbolos que uno puede tener en un canal dado el ancho de banda, que también es válido cuando no se está muestreando. Si no, tendríamos que concluir que la fórmula de Nyquist no se aplica porque no hablamos de muestreo, pero se aplica. * Tanto la señal intermitente de 30 Hz como la señal intermitente de 330 Hz tienen un ancho de banda limitado, lo que genera un alias de símbolo [" indistinguible de otras secuencias de estado"]
@le_top Una vez que comienzas a encenderlo y apagarlo, ya no es un tono de 330 Hz, es algo diferente. Si analiza algo diferente, encontrará cambios en su ancho de banda.
Es correcto que la mayoría de los cambios en una señal de un solo tono darán como resultado un ancho de banda ocupado infinito teórico. Incluso un FSK 300-330 ocupa un ancho de banda infinito. * Pero eso no es tan importante con Nyquist. Lo importante es el ancho de banda que miramos/nuestra frecuencia de muestreo. * Por cierto: ese ancho de banda no está limitado a 600bps, sino a 600 símbolos por segundo. Un símbolo puede transmitir más de un bit. * Un símbolo puede ser un cambio de amplitud o más complejo. * Muestrear una señal implica que usted está limitando el ancho de banda de la señal - aliasing fuera de banda.

Esta es solo una respuesta parcial, pero es de esperar que llegue a los puntos principales que está malinterpretando.

Mi problema es que me cuesta entender por qué el ancho de banda se relaciona con la tasa de bits. ...

Si un cero se expresa como una frecuencia portadora de 30 Hz, un uno se expresa como una frecuencia portadora de 330 Hz y la señal de modulación es de 330 Hz, entonces la tasa de bits máxima es de 660 bps.

Si cambia a 30 Hz para un cero, necesita tener alrededor de 1/60 s para saber realmente que tiene 30 Hz y no 20 Hz o 50 Hz o algo así. Realmente, en este caso, solo está activando y desactivando su portadora de 300 Hz, y la señal de 30 Hz que se envía durante 1/660 s durante los ceros es simplemente confusa.

Para hablar de FSK, tomemos un ejemplo más realista. Digamos que usa 1 MHz para el cero y 1,01 MHz para el uno. Resulta que necesita medir la señal durante aproximadamente 1 / 2 Δ F , en este caso 1/20.000 s, para poder distinguir con fiabilidad esas dos frecuencias. Si solo midiera la señal para 1 us, realmente no podría notar la diferencia entre una señal de 1 MHz y una señal de 1.01 MHz (aunque en un escenario ideal sin ruido podría hacerlo, tal como la fórmula de Shannon dice que puede transmitir datos infinitos con ancho de banda cero cuando SNR llega al infinito)

Entonces, en este ejemplo, la tasa de bits que puede enviar es de aproximadamente 20 kHz, lo que corresponde a 2 veces la diferencia entre sus frecuencias 1 y 0, tal como la fórmula de Nyquist lo lleva a esperar un código de 2 niveles.

Tus preguntas son válidas y el camino hacia una comprensión adecuada de lo que significa la teoría ;-).

A la pregunta de cómo más ancho de banda significa una tasa de bits más alta, la explicación puede parecer simple pero ser mala al mismo tiempo.

Aquí hay una explicación "mala" que se ve bien. Sin embargo, es un comienzo para comprender por qué un mayor ancho de banda es más datos. Supongamos que tengo un primer canal WiFi número 1 funcionando a 1 Mb/s dadas las condiciones de potencia y codificación. Luego tomo otro canal WiFi número 2 que tiene las mismas condiciones de ancho de banda, potencia y codificación. También funciona a 1 Mb/s. Cuando sumo los dos juntos, dupliqué el ancho de banda (dos canales diferentes) y dupliqué el rendimiento de datos (2x1Mb/s).

Si crees que esto parece una explicación perfecta, olvidas que también duplicamos el poder. También lo es el doble rendimiento de datos debido a la potencia duplicada o al ancho de banda duplicado. Es un poco de ambos en realidad.

Si mantengo la potencia total igual mientras duplico el ancho de banda, necesito comparar un primer canal WiFi funcionando a 1 Mb/s con la suma de otros dos canales WiFi funcionando cada uno a la mitad de la potencia recibida. No voy a revisar las hojas de datos de los módems WiFi, pero este sería un ejercicio interesante para comparar con el siguiente enfoque teórico. Shannon nos ayuda a predecir qué pasará más o menos si la codificación se adapta a los niveles de potencia (que es el caso de WiFi). Si la codificación no se adapta, la tasa de datos permanece constante hasta que el nivel de recepción es demasiado bajo, momento en el que cae a 0.

Así que Shannon dice: C=B∗log2(1+S/N) . Al mantener la potencia total, pero duplicando el ancho de banda, C2=2*B*log2(1+(S/2)/N) donde C2 es la velocidad de datos potencial. Rellenando los números reales podríamos suponer que S=2xN por lo que log2(1+2)=1.58 y log2(1+1)=1. Entonces C=B*1.58 y C2=B*2 . En otras palabras, cuando mi nivel de señal en el mayor ancho de banda es igual al nivel de ruido, la tasa de datos potencial es un 26 % más alta que la misma potencia total emitida en la mitad del ancho de banda. Entonces, teóricamente, la banda ultra estrecha no puede ser más eficiente que la banda ultra ancha según el teorema de Shannon. Y duplicar el ancho de banda con el mismo nivel de potencia total no duplica el ancho de banda como sugería nuestro ejemplo WiFi. Pero el ancho de banda es mayor. Si podemos despreciar el término "1" en el log2 de la expresión de Shannon,

Sin embargo, como mencioné, la codificación debe adaptarse, debe optimizarse a la potencia real y al ancho de banda disponible. Si la codificación sigue siendo la misma, simplemente paso de operativa a disfuncional.

Cambiando a su segunda pregunta, si tengo una señal FSK que cambia a 30 Hz con dos frecuencias, entonces solo puedo emitir a 30 bps porque estoy emitiendo 30 símbolos por segundo, cada uno correspondiente a un bit de 1 o 0. Si introduzco 4 estados ( =4 frecuencias) introduciendo dos frecuencias entre las anteriores porque mi nivel de ruido lo permite, entonces emito a 4x30bps=120bps. Con FSK, no creo que el ancho de banda permanezca constante al aumentar el número de estados de esta manera, pero seguramente se puede encontrar la manera de mantenerlo más o menos constante (considerando los límites de 3dB porque el espectro de frecuencia teórico es ilimitado).

¿Por qué usar una onda cuadrada para la señal "moduladora"? Esta es una opción en esta codificación que hace que sea "más fácil" de decodificar, ya que en el lado del receptor simplemente debe tener un filtro de paso de banda para cada frecuencia. Todavía está emitiendo "ondas sinusoidales"; si está emitiendo solo valores "1", tiene solo una frecuencia. Sin embargo, los cambios de frecuencia implican la presencia de "armónicos" que permiten/acompañan estos cambios de frecuencia. Otras codificaciones tienen otras ventajas y desventajas. Por ejemplo, Direct Sequence Spread Spectrum permite tener una señal por debajo del nivel de ruido (y por lo tanto tener requisitos de potencia de antena más bajos para una tasa de bits similar en muchas otras codificaciones), pero es más difícil de decodificar (y por lo tanto requiere más potencia (de cálculo) y complejidad en el circuito decodificador).

Cualquiera que sea la codificación elegida, debe respetar el teorema de Shannon que fija el límite superior. No puede simplemente aplicar Shannon a una codificación como FSK si no ajusta el nivel de potencia, el número de estados y otros parámetros de la señal FSK a medida que cambia el nivel de ruido o el nivel de la señal (distancia). Shannon le permite comprobar la potencia mínima absoluta para un ancho de banda y una velocidad de datos determinados. El método de codificación aumentará el límite mínimo de potencia. Y cuando los niveles de potencia excedan este límite, la tasa de bits simplemente permanecerá constante. Aplicar Shannon allí es simplemente incorrecto si desea explicar que más ancho de banda significa una tasa de bits más alta. El ejemplo de WiFi podría muy bien aplicarse en la práctica para una explicación allí, pero no es la respuesta general basada en el teorema de Shannon.

Editar: releyendo su pregunta, "En el segundo caso, la tasa de bits será un máximo de 660 bps". En realidad, no entiendo completamente cómo llega a 660 bps, ya que su frecuencia cambia solo 30 veces por segundo y codifica en dos frecuencias, que es 1 bit. De ahí mis 30bps arriba. Esta codificación permite un período completo a 30 Hz y 22 períodos completos a 660 Hz para cada símbolo. Pero 22 períodos no cambia el hecho de que solo hay un símbolo. Parece que falta algo o que el razonamiento es incorrecto.

Edit2: lo tengo, lo estás comparando con el límite de nyquist. Este límite de nyquist le indica el límite superior de la tasa de datos dado un ancho de banda y el número de estados por símbolo. Aquí, la codificación FSK seleccionada no es óptima. Está utilizando 30 Hz y 660 Hz. El límite de Nyquist dice que 30bps=2*B*log2(2), por lo tanto, el ancho de banda debe ser de al menos B=15Hz. Sin verificar en detalle, dice más o menos que establecer las frecuencias FSK en 645 Hz y 660 Hz sería una buena optimización del ancho de banda (si FSK es una codificación óptima y sin verificar el ancho de banda preciso debido a los armónicos, los 15 Hz pueden ser demasiado). baja para FSK).

Edición 3: explicación que sigue después de un análisis adicional para explicar aún más la fuente de confusión con otra respuesta y pregunta original.

  • La fórmula de Nyquist se basa en el teorema de muestreo que indica que una señal con un ancho de banda B se reconstruye perfectamente a partir de precisamente 2B muestras por segundo.
  • Por lo tanto, cada una de las muestras 2B puede representar un símbolo (la intensidad puede determinar qué símbolo).
  • Una señal con un ancho de banda de 300 Hz se puede reconstruir con 600 símbolos, ni más ni menos.
  • Esta es la razón por la que existe el "aliasing": la limitación del ancho de banda puede hacer que dos señales diferentes se vean iguales después del muestreo.
  • Si cada símbolo solo representa 2 estados, entonces solo son posibles 600 bps.
  • El FSK de 30 Hz a 330 Hz puede representar más de 600 bps, pero luego debe considerar más de 2 estados por símbolo. Pero ya no es una demodulación FSK porque no solo se puede considerar la frecuencia.