Herramienta para "promediar" una buena copia de un archivo a partir de varias copias de los mismos datos que contienen errores aleatorios escasos

Tengo en mis manos un puñado de casos de diferentes escenarios donde copié algunos datos a mi PC a través de una ruta de transmisión sin detección o corrección de errores incorporada. Tengo o puedo hacer más copias de ellos. El problema es que los archivos no salen dos veces idénticos. Siempre hay algunas diferencias dispersas, con frecuencia diferencias de 1 bit.

Mi idea aquí es intentar corregir estos errores "democráticamente" comparando todas las copias de los mismos datos y, en aquellas compensaciones donde una copia no está de acuerdo, mantener el valor compartido por la mayoría, ignorando el valor que está en minoría.

Dado que los errores de transmisión parecen ser aleatorios y nunca en el mismo lugar, creo que el concepto es válido y podría funcionar.

La pregunta es: ¿Hay algún software que pueda hacer esto? Incluso si requiere una inspección manual, está bien. Probé varios editores hexadecimales, pero no pude encontrar uno que permitiera encontrar diferencias entre 3 o más archivos. Todos ellos parecían estar limitados a comparar solo 2 archivos, lo que, por supuesto, no ayuda a descubrir cuál está mal.

Prefiero el software de código abierto, pero no me opongo al software comercial si no se puede evitar. Mi sistema operativo principal es Windows 7, pero no me importa que me den una recomendación basada en Linux o BSD si no existe una alternativa de Windows.

Esta es principalmente una tarea única, por lo que no me importa un proceso manual intrincado e inconveniente siempre que funcione.

Debería poder lograr esto con unas pocas líneas de Python.
Bueno, aprender a programar, en Python o lo que sea, es un poco exagerado para mí por el momento. Con suerte, hay algo más, preconstruido, que se puede combinar para lograr esto.
También debería poder hacer esto con Vim. Comience con vimtutorialsi necesita una introducción a vim. Luego, aprenda cómo usar vimdiff y cómo usar vim como editor hexadecimal. Luego puede comparar y arreglar sus archivos.
Bien, supongo que tendré que darle una oportunidad a Vim.
El tiempo necesario para aprender vim probablemente se dedique mejor a obtener una licenciatura en ciencias de la computación. :P Es broma, pero en realidad, la vida es demasiado corta para aprender vim. :)

Respuestas (1)

Entonces, ya no tengo esos archivos, pero finalmente encontré un software que habría hecho el trabajo.

https://github.com/sdottaka/winmerge-v2 puede hacer una comparación binaria de 3 vías.

Debe agregar máscaras de nombre de archivo que desea que el programa identifique como binarias, o de lo contrario, se editarán como texto.