Copie retroactivamente el texto resaltado en comentarios en un PDF

Estoy buscando un programa gratuito que pueda copiar retroactivamente el texto resaltado en comentarios en un PDF, tal como lo hace esta herramienta no gratuita.

ingrese la descripción de la imagen aquí

Adobe tiene una opción, la opción "Copiar el texto seleccionado en las ventanas emergentes de comentarios resaltados, tachados y subrayados", que cuando se activa no cambiará los comentarios existentes, solo los nuevos. La herramienta emula retroactivamente la opción.

ingrese la descripción de la imagen aquí

Antes de ejecutar la herramienta:

ingrese la descripción de la imagen aquí

Después:

ingrese la descripción de la imagen aquí

Si es posible, funciona con Windows 7 SP1 x64 Ultimate o Ubuntu 14.04. Idealmente, podría procesar varios archivos PDF a la vez (el escaneo completo del (sub)directorio sería aún mejor) y preguntar sin querer sobrescribir los PDF originales o crear otros nuevos.

Respuestas (3)

Editar después de ver el voto negativo

@ Humano normal ¿Es ese voto negativo porque copié y pegué la misma respuesta entre sí? Puede ser que me sentí hiperactivo después de sentir que había logrado algo aprendiendo un nuevo lenguaje de programación e implementando algo para lo que no hay una solución alternativa.

De todos modos, tomo sus sugerencias con buen espíritu y formateo la respuesta en consecuencia.

Por cierto, he mencionado claramente que no es gratis y cuesta 15 dólares y la aplicación que se muestra en cuestión cuesta 80 dólares. Estoy de acuerdo en que todavía no lo hace gratis.

Respuesta real

Escribí una pequeña aplicación para esto y la alojé en https://pdfcommentextractor.wordpress.com/ ).

He agregado las siguientes características en él:

  1. Provisión para copiar textos resaltados antiguos para comentar ventanas emergentes de forma retroactiva (es decir, no había realizado la configuración explicada anteriormente antes de hacer el comentario).
  2. Provisión para copiar textos destacados para comentar ventanas emergentes para aspectos destacados hechos desde una tableta.
  3. Disposición para especificar delimitadores en el generador de comentarios. Procesamiento de un solo archivo y procesamiento masivo
  4. MI FAVORITO: Provisión para dividir diferentes colores resaltados en diferentes archivos
  5. Busque una cadena y resalte

Si alguien todavía está buscando este requisito, puede probarlo....

Advertencia: no es gratis... Es el resultado de 1 mes de trabajo duro aprendiendo Java y PDFBox. Por lo tanto, no visite el sitio pensando que es una aplicación gratuita.

Pero si alguien quiere tomar el mismo camino y desarrollar desde cero, puedo ayudarlo con sugerencias, si me envía un correo electrónico a wowpdfextractor@gmail.com

También @Normal Human... Había buscado esta solución durante meses y había buscado esta solución en muchos sitios. Es posible que haya intentado publicar en esos sitios tratando de demostrar que he encontrado una solución. Si cree que mi publicación no tiene ningún valor para esta pregunta, no dude en hacer que los moderadores la eliminen. Gracias

Python + PDFMiner debería permitirle crear un script corto para hacer exactamente lo que está buscando:

  • Ambos son gratis
  • Se necesitará un poco de esfuerzo de su parte, pero aquí hay un ejemplo de extensión de PDFMiner .
  • Dicho script debería poder analizar varios archivos.
  • Una vez que lo haya localizado, debería poder extraer fácilmente el texto resaltado con el contexto en un archivo de texto o html.

Creo que esta respuesta (por mí) ofrece (casi) la solución exacta (y gratuita):

https://softwarerecs.stackexchange.com/a/77229/70625

Es "casi"... en el sentido de que NO procesa algunos archivos en un lote, porque es un complemento del Acrobat Reader gratuito.