¿Qué codifica exactamente un formato de imagen sin procesar? [duplicar]

Bien, tengo en mente que una imagen P puede representarse mediante una matriz A bidimensional donde cada elemento de A (también conocido como cada píxel) es un vector con cuatro coordenadas (Rojo, Verde, Azul). ¿Qué cosas adicionales están codificadas en un archivo RAW excepto esta matriz?

Respuestas (2)

Un archivo RAW no consta de píxeles con varias coordenadas de color. Consiste en un solo valor de cada sensor bien en el sensor. Esos valores deben ser demostrados por un algoritmo que tenga algún conocimiento del Bayer u otro filtro que se encuentra frente a los pozos del sensor. Estos algoritmos toman el valor de cada pozo y los de un pequeño vecindario de otros pozos y generan un valor de píxel RGB para esa ubicación.

Los archivos RAW también suelen incluir una o más imágenes de vista previa JPEG preprocesadas, EXIF ​​y otros metadatos, y tal vez algunas otras cosas, todo empaquetado en algún tipo de archivo de "archivo" (algunos usan contenedores TIFF con diferentes secciones para los diferentes tipos de datos , pero eso no es universal), y probablemente con algún nivel de compresión aplicado.

Un archivo de imagen sin procesar incluye valores de luminancia individuales medidos en cada sitio de fotos (a/k/a "sensel" o "pixel well"). Cada valor individual indica cuánta energía luminosa fue absorbida por cada fotositio. Estos valores se enumeran en una secuencia específica.

En este punto, no hay información de "color" en la forma que parece esperar. Solo hay un único valor de luminancia para cada fotosito. No hay un valor "rojo", "verde" o "azul" asignado a cada sitio de fotos. Es cierto que en un sensor de color, hay filtros de color delante de cada sitio de fotos que afectan la cantidad de longitudes de onda de luz que pueden pasar y golpear el sensor, pero los colores que se usan en las máscaras de Bayer no se correlacionan de forma unívoca. base a uno a los colores que usamos en nuestros sistemas de reproducción de color , como RGB o CMYK.

Los tres filtros de color para la mayoría de las cámaras "RGB" enmascaradas de Bayer son realmente 'azul con un toque de violeta', 'verde con un toque de amarillo' y algo entre 'amarillo con un toque de verde' (que imita el ojo humano la mayoría) y 'Amarillo con mucho naranja' (que parece ser más fácil de implementar para un sensor CMOS). Cada filtro no deja pasar luz "solo azul" o "solo verde" o "solo roja". Cada uno de ellos pasa "más azul que verde o rojo", "más verde que azul o rojo" o "más rojo que azul o verde", pero algunas de todas las longitudes de onda pasarán a través de cada color de la matriz de filtros. Al igual que con los conos en la retina humana, hay mucha superposición entre lo que cada filtro deja pasar.

ingrese la descripción de la imagen aquí
La sensibilidad de color de un sensor enmascarado típico de Bayer, que muestra la curva de respuesta a las longitudes de onda de la luz en todo el espectro visible, compre fotositos filtrados por cada color de la matriz de filtros de Bayer. Las cuatro líneas verticales muestran las longitudes de onda que suelen emitir nuestros sistemas de reproducción de color RGB, incluidos aquellos que también utilizan un cuarto canal amarillo. Tenga en cuenta que la sensibilidad máxima de cada filtro de color no se corresponde con las longitudes de onda utilizadas por nuestros sistemas de reproducción de color.

ingrese la descripción de la imagen aquí
Las sensibilidades de los diferentes conos y bastones en la retina humana. Tenga en cuenta que nuestros conos "rojos" son más sensibles a la luz de 564 nm, que es más de un amarillo teñido de verde que de rojo.

Para asignar valores de color a cada píxel de una imagen creada con la información sin procesar del sensor, se comparan los brillos relativos de los sitios de fotos adyacentes filtrados con diferentes colores y se asignan los valores "Rojo", "Verde" y "Azul" a cada píxel. de la imagen resultante. Esto imita de cerca la forma en que nuestros cerebros humanos procesan la información de nuestras retinas para crear una percepción del color a partir de longitudes de onda y combinaciones de longitudes de onda de luz.

Además de las medidas reales de luminancia en cada sitio de fotos, un archivo de imagen sin procesar contiene imágenes de vista previa y metadatos que permiten que una aplicación de procesamiento sin procesar sepa algunas cosas que necesita para procesar esos datos. Estos incluirían (pero no se limitarán a):

  • Vista previa y/o imágenes en miniatura. Estos son básicamente archivos JPEG generados en la cámara en varias resoluciones que pueden ser desde imágenes en miniatura muy pequeñas hasta imágenes de resolución completa. Son generados por el motor de procesamiento JPEG interno de la cámara en función de la configuración de la cámara en el momento en que se tomó la foto. Estas imágenes de vista previa son casi siempre lo que uno ve cuando mira una foto en la pantalla LCD de su cámara. Por lo general, son lo que muestra un sistema operativo o una aplicación de visualización de imágenes que muestra "iconos" o "miniaturas" de cada archivo de imagen en una carpeta u otra colección de imágenes. También son lo que a menudo muestra por primera vez una aplicación de procesamiento de imágenes sin procesar cuando se abre un archivo por primera vez.
  • Identificación de información sobre el sensor. En general, los archivos sin procesar no indican cuántas líneas/columnas contiene el sensor. Se espera que la aplicación de procesamiento pueda acceder a eso en su base de datos al leer la ID de los sensores.
  • Del mismo modo, la información sobre los colores específicos utilizados en la matriz de filtros de color del sensor (máscara de Bayer), suponiendo que tenga uno, no se detalla en los metadatos sin procesar. Se espera que la aplicación de procesamiento sin procesar pueda acceder a esa información desde su base de datos.
  • Información sobre cuándo se tomó la foto (marca de tiempo), qué ajustes de exposición se usaron (apertura/duración de la exposición/ISO (amplificación de la señal analógica)), qué distancia focal, etc. Todos estos están codificados con el estándar EXIF ​​y son (supuestamente) ) estandarizados en todos los fabricantes y modelos de cámaras. Hay muchos campos EXIF ​​"estándar".
  • Más allá de los campos EXIF ​​"estándar" para los metadatos, las cámaras también pueden incluir "notas del fabricante" en la información EXIF. Esto puede incluir lo que el diseñador de la cámara desee incluir. Muchos fabricantes de cámaras incluyen información como la lente específica utilizada (no solo la distancia focal y el número de modelo, sino también el número de serie específico en algunos casos), valores de "píxeles enmascarados" en el sensor utilizado para determinar el nivel de negro incluido en la información EXIF ​​estándar, etc.
  • La cantidad de la sección "notas del fabricante" de la información EXIF ​​que utiliza una aplicación de procesamiento sin procesar depende de la aplicación de procesamiento sin procesar. Los productos de Adobe, por ejemplo, ignoran casi toda la información de las "notas del fabricante". Si un archivo de imagen sin formato se convierte del formato sin formato nativo de la cámara al formato DNG de Adobe, la mayor parte de la información de "notas del fabricante" se elimina y se descarta. Otras aplicaciones de procesamiento sin procesar pueden o no usar desde ninguna parte de la información contenida en las notas del fabricante hasta porciones significativas de esa información.
  • Casi todos los datos de las "notas del fabricante" están codificados para mantenerlos lo más compactos posible. Una lente "EF 70-200 mm f/2.8 L IS II" se puede codificar en el campo "ID de lente" como "57c3bff8" (en binario). Cada fabricante de cámaras y, en algunos casos, cada cámara específica, utilizará sus propios códigos patentados porque el estándar EXIF ​​no designa campos "estándar" ni esquemas de codificación para dicha información.