¿Es RAW de 14 bits mejor que RAW de 12 bits?

Una imagen JPEG regular tiene solo 8 bits para almacenar información sobre el tono de cada píxel. Al almacenar la imagen en formato RAW (por ejemplo, DNG), podemos almacenar el tono usando más bits por píxel, lo que nos brinda un rango más amplio y más opciones para procesar en la computadora.

Mi cámara actual puede grabar imágenes como DNG de 12 bits y normalmente uso RAW. He notado que los modelos más nuevos de DSLR pueden almacenar 14 bits por píxel. A mí me parece una gran ventaja conseguir esos 2 bits más, pero en realidad ¿es una gran diferencia? ¿Vería la diferencia en el posprocesamiento? ¿La diferencia estaría más en las partes oscuras (subexpuestas) o resaltadas (sobreexpuestas) de la imagen?

Corrección pequeña pero importante: los archivos JPEG almacenan 8 bits por canal por píxel: 8 bits de rojo, 8 de verde, 8 de azul, 24 bits en total. Asimismo, RAW almacena 12/14 bits por canal por píxel: 36/42 bits por píxel en total. 8 bits por píxel es lo que obtienes con el formato GIF (o PNG de 8 bits): una paleta máxima de 256 colores que no es buena para las fotos.
+1 a la corrección, pero tenga en cuenta que el archivo sin procesar realmente solo almacena esa cantidad de bits por píxel, donde cada píxel, cada sitio de fotos, se filtra a un color determinado. La conversión de RAW implica la demostración, donde la información a todo color se extrapola inteligentemente de los vecinos. Entonces RAW realmente no almacena 36/42 bits por píxel. (Suponiendo un Bayer estándar o una matriz de filtros de color similar, como es normal para todas las cámaras excepto las Foveon de Sigma).
@MarkWhitaker: corrección adicional (incluso más pequeña ;-): RAW (en la mayoría de las cámaras) almacena 12/14 bits por píxel, de uno de los 3 colores primarios. Los otros dos colores se agregan en el posprocesamiento mediante demostración de Bayer (u otro patrón). Una excepción son los sensores del tipo Foveon, en los que el sensor captura 3 colores por píxel.
La mayoría de las imágenes JPEG almacenan la imagen en formato YCC ( en.wikipedia.org/wiki/YCbCr ). El número de bits para cada canal (luminancia, delta-azul, delta-rojo) se determina cuando se comprime la imagen. La representación de la imagen generalmente se realiza en RGB888, lo que conduce a una pequeña pérdida adicional (más que la compresión) de información. También hay archivos JPEG CMYK e YCCK, aunque son más raros, y hay archivos JPEG de '12 bits', que se procesan en RGB[12][12][12] en lugar de RGB[8][8][8]

Respuestas (3)

Hace alguna diferencia medible pero no cuenta toda la historia. La puntuación de retrato de DxOMark es una evaluación técnica de la salida de varias cámaras específicamente en términos de profundidad de color, que describen cuidadosamente como una " correlación " con la sensibilidad al color, que es el matiz real del color.

Si observa los resultados de esa métrica , puede ver que las cámaras con la puntuación más alta tienen 16 bits por píxel, seguidas de las que tienen 14 bits por píxel. Los costosos respaldos digitales de formato medio obtienen puntajes DxOMark de 24-26 más o menos, seguidos por las mejores SLR con un rango de 23-25. Luego, las cámaras con 12 bits/píxeles vienen a continuación; creo que la superior es de 22 puntos y algo.

Pero tenga en cuenta que DxOMark describe una diferencia de 1 en esta puntuación como "apenas perceptible". Eso es si apenas te estás dando cuenta con mucha atención. Para la mayoría de las personas, las diferencias mucho mayores en la puntuación tampoco se notan en los resultados del mundo real.

El impacto en el mundo real y la percepción final son una de las razones por las que no es gran cosa. ¡Pero hay más! Si va más abajo en la lista, encontrará cámaras más antiguas con una profundidad de 14 bits y puntajes más bajos que las cámaras más nuevas de 12 bits. Así que ese número por sí solo tampoco cuenta toda la historia técnica. La nueva tecnología de sensores y procesamiento mejora los resultados reales de otras formas. Si está comparando las generaciones actuales, más profundidad es mejor, pero no asuma que es todo.

En cuanto a si esto le da más espacio en las sombras o en las luces: en realidad no es que los bits se agreguen en ninguno de los extremos; en cambio, hay más gradación. Imagine que un periódico le da a las películas de una a cuatro estrellas, mientras que otro usa una escala de 1 a 10. Un "10" del segundo periódico no es necesariamente mucho mejor que una reseña de cuatro estrellas del primero, pero los "bits" adicionales permiten más matices. Esta es la misma idea.

Estos sensores aún sufren un corte severo de los reflejos , por lo que, como siempre con lo digital, es mejor exponer para que se conserven y extraigan detalles de la sombra: y sí, una mejor profundidad ayudará hasta cierto punto, si desea publicar- proceso para aclarar las áreas oscuras, ya que (en teoría) habrá más matices para estirar.

Una cosa importante a tener en cuenta es que los 12 o 14 bits del sensor, mientras que los archivos JPEG usan una curva gamma que se ajusta a la percepción humana. Esa no es solo una forma en que JPEG comprime datos: se debe aplicar una curva para que la imagen se vea bien. Dado que esta curva "aplasta" los bits, esa es parte de la razón por la que hay menos diferencia de percepción de lo que cabría esperar. (Pero tener esos datos lineales en forma no curvada es parte de lo que le da a RAW su flexibilidad: es fácil elegir una curva diferente).

Sin embargo, mi punto general es que no miraría el número subyacente para tomar una decisión entre dos cámaras. En su lugar, mira los resultados finales.


Otra referencia externa, que presenta el mismo punto de vista, de la sección de sensores del sitio web "Digital Photography Best Practices and Workflow" de la Sociedad Estadounidense de Fotógrafos de Medios :

En el momento de escribir este artículo [ nb 2009 o anterior ], ninguna cámara DSLR de 35 mm que tenga capacidad de captura de 14 bits muestra claramente una ventaja de calidad de imagen sobre la captura de 12 bits .

Algunos fabricantes de sensores de formato medio reclaman una ventaja con la captura de 16 bits. Sin embargo, nunca hemos visto un estudio (que no sea el del fabricante) que muestre que una mayor profundidad de bits se traduzca en una mayor calidad de imagen basada únicamente en la captura de 16 bits. En general, la diferencia entre la captura de 14 y 16 bits no sería visible (al menos para los humanos) a menos que se aplicara a la imagen una curva de tono severamente pronunciada (del orden de 6-7 paradas).

(Énfasis agregado. Gracias a una respuesta anterior de Aaron Hockley por el indicador).

¡Gran respuesta! Sin embargo, creo que es posible que desee tener en cuenta la forma en que los bits se dividen entre luces, medios tonos y sombras. Usted mencionó que "no es que se agreguen bits en cada extremo, sino que simplemente hay más espacio para la gradación". Según tengo entendido, los niveles se asignan de manera que los reflejos se vuelven más, seguidos de los tonos medios, seguidos de las sombras y luego los oscuros. Subir la profundidad de bits de 12 (4096 niveles) a 14 (16384 niveles) DEBERÍA tener un impacto en las altas luces... y uno significativo en la atenuación de las altas luces cuando alcanzan su punto máximo. Tiene 12,288 niveles de luminancia discretos adicionales más allá de 12 bits.
Suponiendo una distribución binaria de niveles en las altas luces, luces, medios tonos, sombras y sombras en 12 bits: 2048, 1024, 512, 256, 256. Para 14 bits: 8192, 4096, 2048, 1024, 1024. ( Un poco artificial, pero demuestra el punto.) Esa diferencia debería ser visible en los reflejos, particularmente con RAW (la mayoría de las herramientas crudas SÍ aplican una curva de tono cuando importan), y dan como resultado una atenuación más suave y recuperable antes de que los reflejos desaparezcan.
@jrista: invierte ese pensamiento. El problema de las luces quemadas es un problema inevitable, que tiene que ver con la capacidad total de los fotositos. Mayor profundidad de broca no significa pozos más grandes; es que los pozos se muestrean más finamente. Dado que los datos más brillantes ya tienen más bits, agregar más muestreo allí no compra tanto como agregar más a las áreas oscuras menos representadas.
En su ejemplo, pasar de 2048 a 8192 es 4x, y también lo es de 256 a 1024. Pero el nivel superior ya tenía miles de niveles de matices. Considere aún más abajo, donde uno podría pasar de 16 niveles posibles de colores oscuros a 64; ese es un cambio mucho más significativo que de 4096 a 16384, aunque el último es claramente más.
La idea de exponer a la derecha ("ETTR") es cambiar toda la exposición, o al menos los tonos clave, fuera de esos rangos bajos en los que tiene que preocuparse por contar con precisión cantidades muy bajas de fotones. Tener más valores en los rangos bajos hace que eso sea menos importante. (ETTR aún puede ser útil, pero creo que el problema de las luces altas es una preocupación mayor en la mayoría de las tomas prácticas).
Sé que los reflejos quemados son un problema difícil, sin embargo, creo que cuando tienes más niveles para atenuar, es MENOS problema. Estoy completamente de acuerdo contigo en que tener más bits en las sombras limita la necesidad de preocuparse por el conteo de fotones.

Más bits generalmente no significan más rango, sino más precisión. Es decir, los extremos de las escalas, los negros más negros y los blancos más blancos, se quedarán donde están (en 0 y el valor máximo) pero el número de valores entre ellos será mayor con más bits.

Rápidamente cae en rendimientos decrecientes aquí, ya que simplemente no hay necesidad de tanta precisión, y el sensor de la cámara a menudo ni siquiera es capaz de resolver con esa precisión de todos modos.

Sí. :) Esta es una forma agradable y mucho más sucinta de decir lo mismo que mi respuesta. ¡+1 y bienvenido a Stack Exchange!

Creo que existe cierta confusión relacionada con las diferencias entre RAW de 12 y 14 bits en lo que respecta a su impacto en el rango dinámico.

Tengo entendido que el RAW de 14 bits no expande el rango dinámico. No expande ni las luces ni las sombras. Le brinda información más gradual entre los detalles más oscuros y más brillantes que el sensor puede capturar (es como si tuviera 4 veces más tonos de gris). Estoy bastante seguro de que no notaría ninguna diferencia entre las imágenes en bruto de 12 o 14 bits capturadas por el mismo sensor.

Solo por diversión, eche un vistazo a esta prueba de inteligencia de color , estoy bastante seguro de que tiene una gradualidad de menos de 12 bits.

¡Esta prueba de agudeza de color es genial! (Nuevamente) demostró mi punto (a mí mismo) sobre la importancia de un buen monitor. Tengo un excelente Dell U2410 conectado a una computadora portátil HP con una pantalla brillante promedio (color verdadero o como llamen a esta horrible tecnología). Mi navegador está abierto en el escritorio de la computadora portátil y primero hice esa prueba en ese monitor. A los 40 años, saqué un puntaje de 12, que no está nada mal. Entonces decidí hacerlo de nuevo, esta vez en el monitor Dell. ¡Mi puntuación con un buen monitor ahora es un 0 perfecto!
De todos modos, tener más niveles intermedios de color es definitivamente parte de la definición de un rango dinámico. Básicamente, es la relación entre el valor máximo y la unidad mínima medible.
... una cosa más: ve esta prueba de color en su monitor, que probablemente sea de 10 bits en el mejor de los casos, y su navegador probablemente no pueda generar más de 8 o 10 bits, así que sí, la prueba es de menos de 12 bits.
No estoy seguro de que sea más que tangencialmente relevante para la pregunta, pero esa prueba es tan interesante que en cualquier caso recibe un +1 de mí. :)