Herramienta gratuita de comparación de PDF

Estoy buscando una aplicación para comparar dos archivos PDF.

La solicitud debe:

  • ser capaz de resaltar las diferencias entre los dos documentos
  • ser compatible con Mac ya que lo usaré en una Mac
  • ser libre, no quiero gastar nada de dinero

Usaré esto principalmente para comparar las nuevas versiones de los acuerdos de licencia (ya que soy demasiado perezoso para leer un documento de más de 40 páginas cada vez que se realiza un cambio menor)

La aplicación no necesita ser de la App Store, ni necesita ser oficial, todo lo que necesito es que haga muy bien lo que debe hacer (comparar PDF).

No usaré esta aplicación con mucha frecuencia y la aceptaré en cualquiera de los siguientes formatos:

  • Aplicación de la tienda de aplicaciones de Mac
  • aplicación Java
  • Aplicación Web
  • Archivo AppleScript (necesitaré ver el código fuente)
  • Flujo de trabajo del automatizador
  • básicamente cualquier cosa que se ejecute en Mac OS X Yosemite (no beta) y realice la tarea prevista de manera efectiva
¿Consideró convertir los archivos PDF a texto sin formato y usar diff?
Diff es una herramienta de línea de comandos estándar de Unix (consulte en.wikipedia.org/wiki/Diff_utility ), y dado que Mac OS se basa en Unix, estoy bastante seguro de que ya está instalado en su máquina. Para alternativas de GUI, consulte apple.stackexchange.com/questions/3653/…
Probé muchas de esas opciones, incluida la fusión de archivos de Apple, que me gusta mucho, sin embargo, requiere que los archivos PDF estén en formato ASCII... ¿Conoce algún buen convertidor de PDF a ASCII?

Respuestas (6)

Puedes usar DiffNow :

  • es gratis
  • herramienta de diferenciación de aplicaciones web
  • funciona pegando texto; subir archivos; usando direcciones URL

La única limitación es que los archivos deben tener menos de 2048 kb.

La muestra en su sitio ( primer pdf vs. segundo pdf ):

Interfaz de usuario de DiffNow

Entonces, ¿es compatible con archivos PDF que no son ASCII?
sí, puedes usar archivos pdf normales
¿Es solo una aplicación web o una aplicación descargable?
Aplicación web solo afaik
hecho final: parece que esta herramienta funciona con prestosoft.com/edp_examdiffpro.asp?ref=diffreport que parece tener enlaces de descarga

DiffPDF hoy en día es un software pago solo para Windows, pero anteriormente era gratuito y también estaba disponible para OS X. Todavía puede descargar una versión anterior de este tipo .

Permite la comparación tanto visual como textual.

Captura de pantalla tomada de Lifehacker.com

¡Gracias por esto! Funciona bien, pero parece que solo compara página por página, por lo que si agrega una página al principio de un documento, la comparación es inútil.
Hmm, parece que esta versión solo funciona parcialmente en MacOS Mojave. Resalta las diferencias, pero de lo contrario solo me muestra una página en blanco. La búsqueda continúa, supongo.
Para una comparación “visual”, parepdf.com funciona bien.

compare(comando de ImageMagick)

Si desea comparar la apariencia visual de la página 4 a.pdfcon la página 6 de b.pdf, puede usar la herramienta de línea de comandos de ImageMagick compare. Aquí hay una variación de comandos para probar:

compare              a.pdf[3] b.pdf[5]              delta1.pdf
compare -density 300 a.pdf[3] b.pdf[5]              delta2.pdf
compare              a.pdf[3] b.pdf[5] -compose src delta3.pdf
compare              a.pdf[3] b.pdf[5] -fuzz 5%     delta4.pdf

(El recuento de fotogramas/páginas de ImageMagick se basa en cero, por lo que " [3]" significa "página 4"...) Esto creará documentos "delta", donde cada píxel que es diferente entre las páginas se pinta en rojo:

  1. La primera variante mantiene una versión pálida a.pdfcomo imagen de fondo de la página.
  2. La segunda variante utiliza una resolución de 300 PPI(en lugar de la predeterminada 72 PPI).
  3. La tercera variante crea un delta blanco+rojo únicamente (dejando de lado el fondo pálido).
  4. La cuarta variante marca como rojo solo aquellos píxeles que tienen una diferencia de color de más del 5%.

Cabe señalar que la comparación solo funciona si los tamaños de página respectivos de los archivos comparados son exactamente idénticos.

diffpdf(aplicación de interfaz gráfica de usuario)

DiffPDFes una aplicación GUI que puede procesar 2 o 3 entradas de PDF y mostrar las diferencias:

  1. Hay un modo que compara solo el contenido del texto, resaltando las diferencias de palabras y caracteres.
  2. Hay otro modo que compara las diferencias visuales y las destaca.

La página de inicio solo ofrece una versión de pago de Windows ahora, pero las versiones anteriores eran gratuitas. Puede obtener el código fuente, por ejemplo , de Debian , incluye instrucciones de compilación para OS X.

Al comparar archivos PDF, puede elegir entre:

  • comparar los contenidos (es decir, el texto real)
  • comparar las páginas como un todo (comparación visual).

Si bien es posible que esté buscando el primer tipo de comparación, quería ofrecer una forma de comparar dos archivos PDF página por página.

Como he tenido este requisito regularmente en el pasado y no pude encontrar el software necesario para realizar la comparación, escribí el mío y lo puse a disposición en GitHub. Se llama pyPdfCompare y está disponible de forma gratuita.

Funciona bien en OS X y Windows, pero requiere que instale Python 3, Ghostscript e ImageMagick. Además, deberá realizar una pip installpara las bibliotecas que utiliza.

Puede ser un poco demasiado técnico y/o no exactamente lo que estabas buscando, pero quería ofrecer la opción de todos modos, en aras de la exhaustividad.

Para su caso de uso, comparar el texto y descartar todos los elementos de formato y que no sean de texto funcionaría bien. Puede ejecutar la pdftotextutilidad en cada archivo y luego una herramienta de comparación de texto en el resultado. En OS X, puede instalar pdftotextdesde varios canales de distribución de software gratuitos , como Brew o MacPorts, es parte del popplerpaquete.

pdfdiff.pyEl script de Cas Cremers automatiza la ejecución de pdftotext(que debe instalarse por separado) y de un visor de diferencias (ídem).

El resultado es similar a DiffNow citado por ᔕᖺᘎᕊ , creo que lo usan pdftotextinternamente y conectan la salida a una aplicación web de diferencia de texto.

Me imagino que debería agregar una opción más que no es necesariamente una herramienta o función, sino más bien un truco para comparar archivos PDF pequeños (generalmente páginas individuales como currículums).

Si su sistema operativo hace que las ventanas sean semitransparentes cuando las arrastra, puede abrir ambos PDF en su aplicación de visualización de PDF y luego arrastrar una ventana de PDF sobre la otra sin soltarlos. Esto puede permitirle ver a través de la primera ventana semitransparente, a través de la otra ventana de PDF debajo de ella. Si están alineados correctamente entre sí, las diferencias pueden volverse obvias.

A menudo he usado esto como una comparación visual rápida y sucia para verificar si dos PDF de una sola página tienen el mismo contenido, pero dado que no requiere software, debería funcionar en cualquier sistema operativo que tenga este efecto semitransparente al mover ventanas.