¿Cómo encontrar archivos CR2 corruptos?

Hoy descubrí "por accidente" que algunos de mis raws CR2 Canon están dañados. Los datos EXIF ​​y la estructura del archivo están bien, son los datos de la imagen sin procesar los que parecen estar rotos. El convertidor Adobe DNG no informa ningún error y también puedo importar los archivos a Lightroom sin previo aviso. Las vistas previas parecen impecables al principio, pero luego comienzan a mostrar distorsiones. Supongo que la vista previa inicial que veo es el JPG incrustado y una vez que se importan los archivos, Lightroom genera nuevas miniaturas basadas en los datos sin procesar. Mi problema es que estamos hablando de 18.000 archivos que pueden verse afectados y no tengo idea de cómo identificar las imágenes rotas aparte de mirar todos y cada uno de los archivos. Probé un programa llamado ImageVerifier pero tampoco reporta ningún error. Don' ¿Los archivos CR2 tienen sumas de verificación que se pueden usar para detectar archivos rotos? Si lo hacen, ¿hay algún programa que pueda verificar la integridad?

Editar: Aquí hay algunas imágenes que muestran el problema:

ingrese la descripción de la imagen aquí

Y:

ingrese la descripción de la imagen aquí

mi conocimiento sobre este tema es bastante limitado. pero tengo entendido que cr2 no tiene una suma de verificación y que si usó dng de adobe crea una suma de verificación, por lo que una ventaja de usar ese formato de archivo.
La creación de un archivo DNG a partir de un archivo .cr2 corrupto solo dará una suma de verificación que verifique que el DNG sea la misma información contenida en el archivo corrupto a partir del cual se creó.
@smares ¿Puede publicar un ejemplo de cómo se ven las "distorsiones" a las que se refiere?
@MichaelClark actualizó la publicación
Noté que los errores ocurren en imágenes que se tomaron como parte de una serie continua.
Probablemente regeneraría las miniaturas para los archivos CR2 por separado, luego usaría algún software de comparación de imágenes para verificar las diferencias entre la miniatura JPG original y la recién generada. Si la diferencia es mayor que, digamos, el 5 %, es probable que esté dañado. Creo que probablemente puedas usar imagemagick para la comparación de imágenes, y potencialmente también para la extracción.
Por lo que vale, noté esta misma corrupción de fotos que leí de una tarjeta SD a través de un lector / concentrador Angelbird, cuando importé las mismas fotos nuevamente a través de un lector SD de otra marca, todas las fotos se importaron bien.

Respuestas (1)

Esto no ha sido respondido durante mucho tiempo, así que haré un resumen.

La mayoría de los archivos sin formato, incluidos los de Canon, que conozco, no incluyen una suma de verificación en el archivo original entregado por la cámara, por lo que no hay una forma segura de saber que una copia determinada es correcta. Algunos pueden estar tan dañados que no se pueden importar, pero a menudo son incorrectos cuando se ven, pero aún "funcionan" en la mayoría de los programas.

Creo que lo más cerca que la mayoría de nosotros llegamos a una solución viable para el problema es (1) revisar los archivos tan pronto como sea posible y corregir los que tengan problemas, además de (2) usar un flujo de trabajo diseñado para detectar y corregir "poco podrido" después.

A menudo, si se detecta temprano, mientras una copia de las imágenes todavía está en la tarjeta, el software de recuperación o simplemente descargarlo nuevamente puede corregir el problema. Obviamente, el problema se está notando rápidamente, y no tengo una buena solución más que revisar poco después de disparar.

La segunda mitad es, en mi opinión, aún más importante: las imágenes digitales pueden "pudrirse" con el tiempo. Sí, pueden volverse corruptos simplemente sentados allí contigo sin hacerles nada. Copiar a computadoras de reemplazo, discos, ediciones que salen mal, corrupción en los discos (por ejemplo, problemas de índice que hacen que el archivo A también se guarde sobre parte del archivo B) y solo errores de lectura del disco pueden corromper imágenes silenciosamente. Los fotógrafos prolíficos pueden comenzar rápidamente a impulsar la tasa de error esperada de los discos duros a medida que recopilan terabytes de datos; y algunos de estos errores no son detectados por el hardware, e incluso si los detecta el hardware, los sistemas operativos de escritorio que usamos tienden a no manejarlos de manera confiable (o incluso a no reportarlos a veces).

Una serie de técnicas pueden abordar esto:

1) Utilice herramientas que realicen sumas de verificación del archivo una vez cargado, y verifíquelas con las sumas de verificación recalculadas más adelante. Image Verifier fue una herramienta comercial para eso, y otros han contribuido con herramientas de dominio público (escribí una llamada LR Validate para Windows/Lightroom).

2) Utilice sistemas de archivos que integren dicha detección, por ejemplo, zfs y btrfs, y las nuevas referencias de microsoft (personalmente creo que es demasiado inmaduro). Un "matorral zfs", por ejemplo, verificará cada archivo para ver si aún tiene la misma suma de verificación.

3) Convierta a DNG y use la validación de suma de verificación (esta es solo una validación parcial del contenido del archivo; verifica la parte de la imagen pero no todos los metadatos, por lo que puede detectar daños en la imagen con el tiempo, pero no informa que su configuración de desarrollo se perdieron). Esta es la técnica más fácil para la mayoría de las personas (aunque el uso de DNG tiene un costo; yo personalmente no lo hago).

Todos estos se basan en la idea de que realiza copias de seguridad y, cuando se detecta una situación "podrida", puede recuperarse de una de (presumiblemente) varias copias respaldadas.

Sin embargo, me doy cuenta de que esto no aborda el problema central de "si es posible que haya permitido la corrupción, ¿cómo puedo encontrarla ahora?". La mejor sugerencia que tengo es comenzar con una conversión masiva de DNG (no necesita hacer esto para mantener, simplemente puede ejecutar el programa de forma independiente en las carpetas a una carpeta de salida que planea desechar). Image Verifier, si mal no recuerdo, hace esto internamente. Esto no detectará todos los errores, pero puede encontrar algunos.

El resto, creo que tendrás que encontrarlo revisando a ojo. Puede dejar que Lightroom (si lo usa) reconstruya las vistas previas y las escanee a simple vista; Los problemas graves pueden surgir, los menores probablemente no.