Hace unos días estaba en una clase de electrónica en mi estudio. La primera lección fue una introducción al tema principal, bits, señales analógicas, conversión, etc. El profesor preguntó un ejemplo: ¿Cuál es la cantidad máxima factible de bits para almacenar información de audio?
Algunas de las respuestas que se dieron en la clase incluyeron "64 bits, 32 bits, 16 bits, 8 bits (sí, lo sé...)...".
entonces el profesor dijo que son unos 18,19 bits, entonces estás llegando al límite superior porque las distorsiones, el ruido, etc. comienzan a jugar un papel importante en las grabaciones de audio.
Sé que la calidad típica de DVD/Studio es audio de 24 bits.
Sin embargo, esto me llevó a pensar: ¿Cuál es el tamaño máximo de bits físico/real/electrónico en el que se puede almacenar una pieza de audio? ¿El audio de 32 bits sería excesivo/contendría demasiado ruido?
¿Alguna explicación/fuentes sobre esto?
¿Cuál es el tamaño de bits máximo físico/real/electrónico en el que se puede almacenar una pieza de audio?
Como comenta Dzarda, esta no es una pregunta sensata, y no está claro qué quiere decir con 'pieza'. Si te refieres a una muestra, puedes almacenarla en tantos bits como puedas almacenar. Los discos duros típicos contienen 1 TB y más, por lo que 8 Tera Bits estarían al alcance.
¿El audio de 32 bits será excesivo/contendrá demasiado ruido?
Es una exageración del mismo modo que no tiene sentido proteger tu bicicleta con una cadena muy pesada que se cierra con un candado de plástico blando. Será mejor que gaste menos dinero en la cadena y lo use para comprar un mejor candado.
En aras del argumento, digamos que la relación señal/ruido de las partes analógicas de su sistema de audio corresponde a 16 bits. Si reproduce sonido digital almacenado como 18 bits que agrega ~ 3% de ese nivel de ruido: aumentó el ruido en ~ 3%. (de 100 a 125, en unidades arbitrarias). 20 bits lo incrementarán en un 0,7%. 32 bits en un 0,00098 %. Es decir: suponiendo que tenga una traducción perfecta de digital a analógico.
El costo del almacenamiento aumenta linealmente con el tamaño de bit, el costo de un convertidor D/A con precisión de rango completo aumenta casi exponencialmente cuando se acerca a una cierta cantidad de bits (¿~22?). Entonces, usar más bits que la calidad equivalente en las partes analógicas cuesta más, pero la ganancia en calidad disminuye. Por lo tanto, simplemente no es económico usar más bits: si desea gastar más dinero para obtener una mejor calidad, debe gastarlo en las partes analógicas. (No soy un audiófilo, pero AFAIK, el altavoz suele ser el eslabón más débil).
Este es un tema común en la ingeniería: no se trata de hacer las piezas individuales lo mejor posible, sino de un diseño equilibrado.
La tecnología podría permitirle almacenar datos (casi) infinitamente grandes (muestras/segundo) e infinitamente profundos (bits), y de hecho, muchas cosas almacenan este tipo de cosas: hay muchas cámaras que pueden grabar más rápido y con más detalles que los humanos. los ojos pueden ver, por ejemplo, 500 fotogramas por segundo. Del mismo modo, hay instrumentos científicos como los sismómetros que (simplistamente) se parecen mucho a los micrófonos pero son mucho más sensibles que el oído humano, y los datos grabados probablemente se almacenan con más detalle de lo que un humano podría interpretar directamente si se reprodujera en el mundo real. niveles Sin embargo, estos diversos dispositivos casi siempre se utilizan para capturar cosas para que podamos analizarlas de alguna otra manera: una onda en un gráfico, un video en cámara lenta, etc.
Volviendo a la grabación y reproducción de audio, nuevamente hay instrumentos científicos y de prueba que pueden muestrear, grabar, reproducir y generar señales de mucha mejor calidad (como en resolución/profundidad/precisión) que las que los humanos pueden procesar, pero no tiene mucho sentido tenerlos. en un estudio de grabación.
Ahora, en un estudio multipista realmente bueno, es posible que desee una mejor calidad de la que los humanos pueden discernir a medida que agrega muchas cosas juntas, por lo que cuanto menos error introduzca, mejor saldrá en la mezcla final. Simplistamente de nuevo; si hace todas las sumas duras usando 4 lugares decimales, es posible que su respuesta final solo deba ser de 1 lugar decimal, pero aún podría salir mejor ya que no habrá perdido tanto en los errores de redondeo.
En el caso final (consumo humano), los humanos solo pueden discernir una cantidad limitada, por lo que el equipo generalmente está hecho para ser lo suficientemente bueno para eso, porque ¿por qué haría más trabajo sin obtener ganancias?
Como ejemplo: la imagen digital ha alcanzado un máximo de 8 bits por color porque el ojo no puede distinguir más de 256 tonos de gris / la combinación total de 16,8 millones de colores y tonos. Tenemos PC de 64 bits y cámaras digitales mucho mejores en estos días, podríamos almacenar 16 bits por color, pero las personas no pueden ver 281,474,976,710,656 colores diferentes y perderíamos mucho esfuerzo capturando y almacenando esos datos.
Del mismo modo, nadie pagará por un estudio de grabación lleno de equipos que pueden escuchar, capturar, grabar y reproducir un pedo de mosca en el fondo de la sala sobre alguien golpeando una batería, ya que nadie lo escuchará, incluso si es allá.
Divertido.. para jugar con algunos números. Supongamos 1 k ohm de impedancia de fuente. (Tienes que suponer algo). Así que eso tiene ~4nV/rtHz de ruido Johnson. Para un ancho de banda de 10kHz, eso es ~400nV de ruido. OK y suponga que ha ganado hasta 5 voltios y almacenado. Eso es alrededor de 10^7 en rango dinámico... 23 bits. (En la vida real habrá más ruido...)
En el caso del audio que se transmite por teléfono, los niveles de cuantificación para el A/D, vienen determinados por el sistema de modelado de nivel de ruido. Es decir, no debemos aumentar los niveles de cuantización, porque se incluye ruido dentro de los valores convertidos. Además, el oído no responde de forma lineal, por lo que para optimizar el ancho de banda de la señal transmitida por teléfono se utiliza una conversión no lineal, que permite codificar el audio en 8 bits y recuperar una señal inteligible.
Evidentemente, la calidad de transmisión de audio para un teléfono, no es la que está pensada para un sistema de audio de alta fidelidad.
En resumen, la teoría establece que no existe un límite superior para el número de niveles de cuantificación de una señal de audio, pero en la práctica, el ruido presente en el sistema puede poner un límite superior. Para más información consulta este enlace .
El audio de 32 bits almacenado en formato de punto flotante es común en la industria profesional. Sin embargo, eso es para reducir los errores de redondeo durante el procesamiento digital, donde se procesa en gran medida a través de todo tipo de filtros y transformaciones digitales. En cuanto a la grabación o la reproducción, no creo que nadie pueda distinguir entre 24 bits a 192 kHz y un muestreo más profundo y rápido. Probablemente ni siquiera los murciélagos.
Parece que necesita comprender algunos términos básicos. Hay convertidores AD<->DA de diferentes tamaños de "bits" y diferentes frecuencias operativas. El tamaño de bit afecta la precisión de la "muestra", mientras que la frecuencia afecta la tasa de muestreo.Por lo general, tiene una señal de audio que desea digitalizar. Entonces, la primera pregunta que debe responder es, ¿qué tan precisa debe ser la muestra? Cuanto mayor sea el número de bits utilizados, mayor será la calidad del audio reproducido y mayor será el costo del convertidor. Cuanto mayor sea la frecuencia de muestreo, mayor será la calidad del audio reproducido y mayor será el costo del convertidor. Entonces, el primer límite práctico lo impone el costo del convertidor. Hay otro límite práctico impuesto por la "sensibilidad humana". Si nuestros oídos no pueden detectar una diferencia entre el audio original y el reproducido, entonces la cantidad de bits y la frecuencia de muestreo utilizada para lograrlo serán "suficientemente buenos". Con base en esta información, creo que su pregunta debería ser:
¿Cuál debería ser el número máximo, práctico, de bits (de un convertidor AD <-> DA) para poder reproducir una copia aceptable de una señal de audio?
Creo que los cálculos apropiados darían aproximadamente 18 bits con una frecuencia de muestreo de 150K Hz.
Dzarda
jimmyb
Nayuki