Encontrar imágenes casi duplicadas en fotos escaneadas

Tengo muchas fotos impresas que he estado digitalizando. Da la casualidad de que algunas fotos se imprimieron más de una vez y, por lo tanto, se han digitalizado más de una vez. Estoy tratando de encontrar esas fotos para poder eliminar los duplicados.

Esta es una pregunta similar , sin embargo, los duplicados como se indica en esa pregunta parecen provenir de la misma imagen digital. En mi caso, las fotos son escaneos de diferentes fotos físicas, por lo que dos preguntas duplicadas pueden diferir un poco más (por ejemplo, iluminación ligeramente diferente).

El software debe escanear una carpeta de imágenes y comparar las fotos en la carpeta entre sí y devolver de alguna manera imágenes que sean muy similares (dos escaneos de la misma foto física) para que el usuario pueda eliminar los duplicados manualmente (después de confirmar comparando el imágenes manualmente).

Requisitos para el software:

  • Trabajar en Windows (también podría estar basado en la web);

  • Gratis o pagado;

  • Capaz de importar una carpeta de imágenes (digamos unos cientos de imágenes en una carpeta) y comparar las imágenes en esa carpeta.

Esta pregunta también es muy similar, sin embargo, pide ordenar las imágenes por similitud. Mi pregunta es más específica sobre lo que quiero decir con similar (es decir, diferentes escaneos de la misma foto).

Eliminé mi respuesta, ya que era completamente incorrecta. Tengo el software correcto en algún lugar de mi colección de unas treinta unidades flash. Cometí un error basado en el programa instalado en mi computadora, que no es adecuado para sus propósitos. Si puedo encontrar el correcto, lo volveré a publicar.
Para la parte técnica: en mi humilde opinión, las imágenes pueden diferir unos pocos grados, por ejemplo, +/- 5 °, luego 85-95 °, 175-185 ° y 265-275 °. A continuación, podrían diferir en color como dijiste. ¿También podría diferir en el resultado (recuento de píxeles, debido a diferentes configuraciones de DPI)? ¿También podrían diferir en tamaño (cm, porque se imprimieron en diferentes tamaños)?
@ThomasWeller Sí (a todos). Las imágenes se escanean con la cámara de un teléfono y una aplicación determina el borde de las imágenes. Por lo tanto, creo que el software realmente necesita usar alguna técnica de procesamiento de imágenes. Sé que hay software para detectar ciertos objetos (por ejemplo, para encontrar imágenes con autos o gatos en ellos). Ese software obviamente se entrenó usando enormes bibliotecas. En este caso, creo que tendría que determinar características o patrones en cada imagen y luego compararlos. Obviamente, esto no obtendrá todos los duplicados y podría marcar los FP, pero sería mucho más fácil que hacerlo manualmente.
Creo que las versiones más nuevas de Lightroom pueden hacer esto, incluso sin la ayuda de complementos. Consulte photo.stackexchange.com/questions/10213/… pero no he probado ninguno de estos consejos.

Respuestas (1)

Hay algunos programas que funcionan bastante decentemente. Desafortunadamente, uno de ellos (creo) ya no está en desarrollo. Es una pena.

VisiPics califica la similitud usando colores. http://www.visipics.info/index.php?title=Main_Page

Pixiple también le brinda imágenes similares, esto puede ser útil para detectar la misma imagen con algunos cambios en el recorte o la rotación, pero detectará, por ejemplo, imágenes de la misma sesión de fotos, así que tenga cuidado de que su dedo "eliminar" no esté demasiado flojo. https://github.com/olaolsso/pixiple