¿Cuántas paradas hay entre el gris medio y el punto blanco?

Estoy tratando de entender la relación entre la exposición, el rango dinámico, las paradas de luz y el gris medio. Voy a hacer varias preguntas sobre ese tema. Algunos de ellos pueden ser estúpidos o planteados incorrectamente. Por favor, tengan paciencia conmigo, estoy realmente perdido y carezco sustancialmente de algunos conocimientos importantes. Y no tengo ni idea de por dónde empezar.

  • ¿Cuántas paradas de luz hay entre el punto negro RGB(0, 0, 0) y el punto blanco RGB(255, 255, 255)? ¿Es lo mismo que el rango dinámico de la cámara medido por DxOMark?
  • ¿Cuántas paradas hay entre el gris medio, que es RGB (119, 119, 119), y el punto blanco?
  • ¿La distancia en paradas entre el gris medio y el punto blanco depende del modelo de mi cámara?
  • ¿Cómo puedo medir la distancia real en paradas entre el punto gris medio y el punto blanco en casa?
  • ¿Cómo puedo calcular la distancia teórica entre el gris medio y el punto blanco según las especificaciones de una cámara y las medidas de otra persona?
  • En general, ¿cómo calcular la distancia en paradas entre un gris RGB(n,n,n) y un gris RGB(m,m,m)?
  • ¿Cómo sumar o restar un número específico de paradas a un gris RGB (n, n, n) sin Lightroom?
  • ¿Dónde puedo aprender todo esto por mi cuenta? ¿Alguna recomendación de libros o cursos en línea?

Por lo general, disparo con Adobe RGB y luego convierto a sRGB para web. ¿La respuesta a cualquiera de las anteriores depende del espacio de color de destino de la foto?

Este artículo también es valioso: cambridgeincolour.com/tutorials/dynamic-range.htm
Esto no solo varía según la cámara (de lo contrario, todas tendrían el mismo DR), también varía según la configuración (Contraste, Tono, etc.). Así que voy a decir imposible de responder .
@PhilipKendall Fui tímido porque es una respuesta parcial... Pero probablemente tengas razón.
@Fumidu No seas tímido :-) Una respuesta parcial es mejor que ninguna respuesta.

Respuestas (3)

Introducción
Según sus preguntas, tengo la impresión de que se pierde un punto importante, y esa es la diferencia entre:

  • percepción de la luz en el mundo real,
  • percepción de la luz en el mundo tal como lo perciben los humanos,
  • percepción de la luz a medida que el sensor de la cámara la registra,
  • percepción de la luz como formatos de imagen y su computadora lo percibe (o procesa).

El mundo real tiene una gran cantidad de paradas entre el punto negro y el punto blanco. Las estrellas distantes emiten solo unos pocos fotones por segundo hacia nosotros, mientras que el sol nos arroja alrededor de 10 ^ 17 fotos por segundo. Eso es alrededor de 57 paradas (!). Los ojos humanos pueden ver alrededor de 10 a 14 paradas de rango dinámico en cualquier momento ( fuente ) y alrededor de 24 paradas cuando tenemos tiempo para ajustar nuestros ojos ( fuente ). Los sensores de las DSLR están justo debajo de eso (8-11 paradas). Los sensores más pequeños a menudo tienen un rango dinámico más bajo. El procesamiento de imágenes digitales a 8 bits tiene exactamente 8 paradas de rango dinámico.

Tratando de responder a sus preguntas
Intentaré responder a sus preguntas lo mejor que pueda. Mi objetivo es brindarle información en lugar de solo darle una respuesta directa, porque creo que se ajusta mejor a la intención de su(s) pregunta(s).

  • ¿Cuántas paradas de luz hay entre el punto negro RGB(0, 0, 0) y el punto blanco RGB(255, 255, 255)? ¿Es lo mismo que el rango dinámico de la cámara medido por DxOMark?

Hay 8 paradas entre RGB 0 y RGB 255 si su gamma es 1. Por ejemplo, si uso Photoshop para iluminar un color RGB (119, 119, 119) usando la función Exposición a RGB 255, necesito agregar +2,42 se detiene Pero necesito subexponer -11,48 antes de llegar a RGB (0,0,0). Si tiene el panel de información abierto y su selector de color en el parche de color mientras desliza el medidor de exposición, verá que los valores RGB cambian más rápido al agregar exposición y más lentos al deslizar la exposición hacia abajo. Como se menciona en la respuesta de @Fumidu, se debe al valor gamma predeterminado de 2,2.

  • ¿Cuántas paradas hay entre el gris medio, que es RGB (119, 119, 119), y el punto blanco?

Mientras habla de valores RGB, se encuentra en el mundo del procesamiento de computadoras. Las paradas son traducciones del mundo real (el doble de luz) a imágenes digitales. En pocas palabras, esto depende de cómo su computadora (y su software de imágenes) maneje la "exposición". En otras palabras: esto depende de la gamma. Mi experimento en Photoshop dio como resultado +2,42 paradas. Pero así es como Photoshop maneja el gamma y la exposición. Basado en la idea, la parada es el doble de luces y si asume una gamma de 1 (doble luz significa valores RGB dobles), es (ln(255)-ln(119)) / ln(2) = 1,1 paradas (redondeado a 2 dígitos). Simplemente puede multiplicar por gamma, si no es 1. Basado en gamma 2.2, es 2,2 * (ln(255)-ln(119) ) / ln(2) = 2,42 paradas, lo que coincide con mi resultado experimental en Photoshop.

  • ¿La distancia en paradas entre el gris medio y el punto blanco depende del modelo de mi cámara?

Sí. El depende de dos cosas:

  • El rango dinámico de tu cámara
  • La forma en que su cámara maneja ISO en relación con el rango dinámico

Si su rango dinámico es 10, tiene 5 paradas por debajo del gris medio y 5 paradas por encima. Pero según el valor ISO, su cámara puede dar más prioridad a las sombras y compensar el gris medio, por ejemplo, en ISO 800, tiene 6 paradas por debajo del gris medio y 4 paradas por encima (para capturar más detalles de sombra en el a expensas del riesgo de recorte de luces). Aquí hay un artículo que explica esto para una cámara de video, pero las cámaras fotográficas digitales hacen exactamente lo mismo.

  • ¿Cómo puedo medir la distancia real en paradas entre el punto gris medio y el punto blanco en casa?

Instale su cámara en un trípode o superficie estable. Coloque un trozo de papel blanco frente a la cámara. Asegúrese de que la hoja de papel esté iluminada uniformemente y que la fuente de luz sea constante y preferiblemente bastante blanca (o ajuste el balance de blancos). Pon tu cámara en modo manual, establece el ISO fijo en 100 ISO, pon la apertura en un valor razonable (5.6 u 8 sería genial) y comienza a tomar fotos a diferentes velocidades de obturación. Mida el brillo de los píxeles (valor RGB) y observe cuántas paradas hay entre (casi) exposiciones en negro (<10 valor RGB) y (casi) exposiciones brillantes (>250 valor RGB). Ahí tienes el rango dinámico de tu cámara.

Este artículo lo explica con un poco más de detalle.

  • ¿Cómo puedo calcular la distancia teórica entre el gris medio y el punto blanco según las especificaciones de una cámara y las medidas de otra persona?

Como regla general: 5 o 6 paradas serían una buena suposición para las DSLR (4 o 5 para las cámaras compactas). Si conoce el rango dinámico, es la mitad del rango dinámico. Reste una parada para ISO alta (800-6400) y 2 paradas para ISO extremadamente alta (6400 y más).

El problema es que el rango dinámico a menudo no forma parte de las especificaciones de la cámara. Además, la forma en que la cámara maneja las clasificaciones ISO más altas es parte de la magia de procesamiento de una cámara y, a menudo, no está disponible públicamente. Para resumir: una conjetura educada general se acerca bastante. Calcularlo es (por falta de especificaciones) prácticamente imposible.

  • En general, ¿cómo calcular la distancia en paradas entre un gris RGB(n,n,n) y un gris RGB(m,m,m)?

paradas = gamma * ( ln(n) - ln(m) ) / ln(2)
ln es el logaritmo natural; pero si lo prefiere, también puede usar log, que le dará los mismos resultados.
Entonces, de 119 a 255, es n = 119, m 255, gamma = 2.2, paradas = 2,42.

  • ¿Cómo sumar o restar un número específico de paradas a un gris RGB (n, n, n) sin Lightroom?

Usando la fórmula anterior, puede usar cualquier software o herramienta de programación para hacer esto. No estoy seguro de lo que estás buscando.

  • ¿Dónde puedo aprender todo esto por mi cuenta? ¿Alguna recomendación de libros o cursos en línea?

Esto es muy personal, pero algunos de mis favoritos son:

¡Muchas gracias! Eso da la mayor parte de la información que necesitaba. Por "distancia teórica" ​​me refiero a cómo predecir el resultado del experimento casero a partir de la pregunta anterior en papel, sin realizar realmente el experimento.
ah Entiendo. Edité la respuesta en consecuencia.

Supongo que la tarjeta gris es del 18%. Luego, en comparación con una reflectancia máxima del 100 %, las paradas lineales son cada mitad, o en pasos de 100 %, 50 %, 25 %, 12,5 %, 6,25 %, etc. Entonces, el 18 % sería alrededor de 2,5 paradas hacia abajo.

Pero NO se verá así en su histograma, porque todos los datos RGB en los histogramas de la cámara están codificados con gamma, que es una historia diferente. En un histograma gamma, una parada hacia abajo está más cerca de una escala de 3/4 que de una escala de 1/2 (73%, pero variará un poco con las correcciones de la cámara, como el balance de blancos y el contraste, etc.).

En una escala normalizada de 0..1, 18% con gamma sería (0.18 ^ 1/2.2) = 0.46. Y 46% x 255 = 117, un poco menos de 1/2 escala. No es lineal allí, pero sigue estando alrededor de 2,5 paradas hacia abajo.

La gente tiende a no darse cuenta de que los histogramas están codificados con gamma, en lugar de una escala lineal idealizada. Pero nunca vemos una escala lineal, todos nuestros datos RGB están codificados con gamma y el histograma lo muestra.

Una parada es un factor 2 de la luz (-1 parada => la mitad de la luz, +1 parada => el doble de la luz). Entonces, un byte (8 bits) tiene un rango dinámico de 8 paradas. Es menos que una buena cámara, que puede tener hasta 13 o 14 pasos de rango dinámico.

Entonces, ¿cómo lidiamos con este problema? Es imposible poner 13 bits de un archivo sin formato en los 8 bits de un archivo jpeg sin perder algo de información. La compresión gamma se utiliza para mantener las piezas de información más relevantes en relación con el funcionamiento del ojo humano.

en.wikipedia.org/wiki/Gamma_correction

La respuesta de WayneF proporciona un buen ejemplo de cálculo para el gris medio.

Además, debe comprender que el sensor de una cámara responde linealmente a la luz, pero el ojo responde de forma no lineal, y esa es otra razón por la que se usa la compresión gamma.

El número binario sin procesar es una cantidad abstracta, no tiene relación con las "paradas" fotográficas, el número de 8 bits puede transmitir 1 parada, 8 paradas u 80 paradas, según la interpretación.
Tienes razón, depende de muchas cosas, y sobre todo del valor de Gamma. Sin embargo, 8 bits no puede almacenar más de 8 "órdenes de magnitud" de nada sin perder algo de información. ¿Cómo deberíamos llamar a esa noción de "órdenes de magnitud"?
Decir que el número de 8 bits almacena 8 paradas sin perder información tampoco tiene sentido, porque nos gustaría saber a qué resolución (ver: bandas de color) se guarda la cantidad dada de paradas (no hay una resolución "natural", y usted siempre se puede aumentar o disminuir). Y, de hecho, la interpretación "natural" de nuestro número sin procesar de 8 bits tiene un número infinito de paradas, no 8 paradas, porque tenemos 0-255 y cualquier número por encima de cero es infinitamente más brillante que el brillo cero... por supuesto, el color la resolución varía mucho ;-)
Gamma NO se trata del ojo humano, y gamma NO aumenta el rango dinámico. Los datos gamma SIEMPRE se decodifican antes de que cualquier ojo humano los vea. Gamma se realizó para corregir los monitores CRT, que pierden la decodificación automática, sin dejar codificación gamma. Los monitores LCD son lineales y no necesitan gamma, pero todos los datos RGB ya están codificados, por lo que los monitores LCD simplemente los decodifican antes de mostrarlos.
Y gamma es una función exponencial, normalizada a 0..1, y 0 a cualquier exponente es 0, y 1 a cualquier exponente es 1, por lo que los puntos finales NO PUEDEN cambiar, por lo que el rango dinámico NO PUEDE aumentar. Además, se decodifica de nuevo en 8 bits antes de que lo veamos de todos modos.
Primera línea de Wikipedia - Gamma_Correction - Explicación: "La codificación gamma de imágenes se utiliza para optimizar el uso de bits al codificar una imagen, o el ancho de banda utilizado para transportar una imagen, aprovechando la forma no lineal en que los humanos perciben la luz y color." También es cierto que se necesita para corregir monitores CRT, pero también está definitivamente ligado al ojo humano.
Lo siento, Wikipedia obviamente está equivocada en ese punto. Algunos dicen eso, pero siempre está mal. El ojo humano NUNCA ve ningún dato gamma. Las pérdidas del CRT lo decodifican, con el único fin de que el ojo vea los niveles de imagen originales antes que las pérdidas del CRT. Los monitores LCD son lineales y no necesitan gamma, pero para la compatibilidad de imágenes, el chip LCD simplemente decodifica y descarta la gamma. Deben hacer esto, ya que todas las imágenes RGB siempre fueron codificadas con gamma para CRT, y DEBEN eliminarse antes de que el ojo las vea. Si el ojo fuera a ver datos gamma, los valores bajos serían intensamente demasiado brillantes.
Está bien. ¿Tiene alguna fuente sobre la sensibilidad del ojo humano a la luz? La mayoría de los enlaces hablan de la sensibilidad del color, pero no de la intensidad. El único enlace que encontré es este: telescopio-optics.net/eye_intensity_response.htm y tiene estas ecuaciones: S=2.3klog10I+C y S=kI^a con S para Sensation, y I Intensity of light. Ambas ecuaciones son aproximaciones de la respuesta bastante compleja del ojo. ¿Qué piensas?
Y también: cambridgeincolour.com/tutorials/gamma-correction.htm Es una muy buena explicación, mejor que la de wikipedia.
Y también está mal. Demasiados que no saben explicar de todos modos. El ojo tiene una respuesta inversa similar a gamma, pero eso es pura coincidencia. El ojo NUNCA puede ver datos gamma. El cerebro maneja el ojo y el CRT maneja los datos gamma. Gamma NO está involucrado cuando el ojo ve la escena original, y gamma solo corrige las pérdidas del CRT para reproducirlo nuevamente de la misma manera original (sin gamma). El ojo espera datos lineales, y el ojo NUNCA ve datos gamma. Gamma se hace para el CRT, NO para el ojo. Piénsalo más, es obvio.
Creo que los dos estamos de acuerdo en eso. Es obvio que el ojo no ve datos gamma y siempre espera información lineal. PERO si solo tiene 8 bits, es mejor codificar los datos con gamma. Las imágenes codificadas con gamma almacenan tonos de manera más eficiente. Dado que la codificación gamma redistribuye los niveles tonales más cerca de cómo los perciben nuestros ojos, se necesitan menos bits para describir un rango tonal dado. De lo contrario, se dedicaría un exceso de bits para describir los tonos más brillantes (donde la cámara es más sensible), y quedaría una escasez de bits para describir los tonos más oscuros (donde la cámara es menos sensible)
@Fumidu: Gamma no es importante para 8 bits, porque es de esperar que los monitores lo decodifiquen a los mismos valores lineales originales antes de que nuestro ojo lo vea. Los monitores LCD más baratos lo decodifican en 6 bits de valores lineales originales y luego lo muestran. La decodificación de CRT es analógica, pero aún no es importante (aparte de corregir las pérdidas de CRT), porque el único plan es que el ojo vea los datos originales lineales decodificados. Si la salida del monitor no coincide con la escena lineal original, se trata de un error de reproducción.
Límites de texto cortos molestos. :) Gamma tampoco puede aumentar el rango dinámico, porque ambos extremos (normalizados 0..1) a cualquier exponente es el mismo 0 y 1 (gamma no puede causar recorte). Gamma se hace solo para corregir las pérdidas de CRT, pura y simplemente, cierto también en 1940. Pero aún se mantiene hoy como no operativo, solo para compatibilidad de datos ahora.
Por favor, vuelva a leer esta página: cambridgeincolour.com/tutorials/gamma-correction.htm , especialmente la parte con las imágenes de bandas en degradado lineal. De hecho, Gamma no aumenta el rango dinámico. Pero permite almacenar la información lineal del sensor de una manera que se adapta mejor al ojo: Gamma = menos bandas en áreas oscuras. Al principio, tienes razón, la gamma era necesaria para corregir el CRT. Debido a un poco de suerte en la ingeniería, la gamma nativa de un CRT es 2.5, casi la inversa de nuestros ojos.