Tengo muchas fotos de la web a las que me gustaría agregar datos EXIF de GPS, pero confío en eliminar duplicados usando herramientas de comparación como cmp
, md5sum
y duff
.
Si edito los datos EXIF, entonces ninguna herramienta que conozco reconocerá imágenes duplicadas. Estoy buscando una herramienta (o un comando de tubería confiable de 1 línea) que pueda:
¿Existe tal herramienta? (¿O hay algún artículo que explique por qué es un problema que no vale la pena resolver?)
La razón por la que prefiero un resumen a un verificador de duplicados de caja negra es que me gusta crear .txt
archivos planos como una base de datos de otra información interesante sobre imágenes (por ejemplo, clasificación de imágenes).
Puede usar exiftool para eliminar todos los metadatos y generar lo que queda, es decir, la imagen para estandarizar en formato binario con el comando:
exiftool filename.jpg -all= -o - -b
Y, por supuesto md5sum
, será estándar como entrada, por lo que debería poder construir una tubería como:
exiftool filename.jpg -all= -o - -b | md5sum -
Por alguna razón, exiftool no funcionó para mí, ya que parecía dejar algunos metadatos, pero reemplazarlo con imagemagick convert funcionó muy bien:
convert -strip filename.jpg -| md5sum
steve barnes
Sridhar Sarnobat