¿Existe un software PDF capaz de encontrar, extraer, seleccionar y luego resumir las anotaciones/comentarios en función de un criterio de búsqueda?

  • Aquí está la situación : tengo 700 archivos pdf en una carpeta (¡esos archivos tienen que estar allí!). Cada archivo contiene docenas o cientos de anotaciones/comentarios. Cada anotación/comentario tiene palabras clave para identificar un proyecto o un tema .

  • Esta es la necesidad : para un proyecto/tema determinado, reunir en un archivo pdf todas las anotaciones/comentarios de todos los pdf en esa carpeta, anotaciones/comentarios que pertenecen a este proyecto determinado.

  • Detalles : Hay dos operaciones aquí: 1) encontrar/extraer las anotaciones/comentarios; 2) luego seleccionar solo las anotaciones/comentarios encontrados y resumirlos en un archivo pdf.

  • Aquí está la pregunta : ¿Existe un software de PDF capaz de encontrar, extraer, seleccionar y luego resumir las anotaciones/comentarios en función de un criterio de búsqueda como una palabra clave , por ejemplo, el nombre de un proyecto ?

  • Mi experiencia : probé muchos softwares, pero fue en vano. XChange Editor 6 estuvo cerca. Es capaz de hacer la primera operación. El Panel de búsqueda puede mostrar solo aquellas anotaciones/comentarios basados ​​en una búsqueda de palabra clave determinada de todos los archivos pdf (la búsqueda se puede realizar dentro de las anotaciones/comentarios). Esto es poderoso ya que puede navegar a través de las anotaciones/comentarios encontrados. Pero, como no es capaz de hacer la segunda operación, es decir, seleccionar y resumir sólo las anotaciones/comentarios encontrados, tengo que rehacer la búsqueda cada vez que quiero trabajar en un proyecto o tema determinado.

Aquí hay una captura de pantalla para ayudar a entender lo que quiero decir:

ingrese la descripción de la imagen aquí

Como puede ver, estoy usando XChange Editor. Entonces, como dije, XChange Editor va a la mitad. A la izquierda, vemos el texto resaltado en amarillo con el mensaje emergente abierto. Agrego a la primera línea del mensaje emergente el código de proyecto 0025 y una etiqueta/palabra clave de asunto, en ese caso la etiqueta es 'Frege'. Esta línea va seguida del texto resaltado, que XChange copió automáticamente en el mensaje emergente.

A la derecha, verá el Panel de búsqueda. El panel de búsqueda realiza la primera operación definida por mí: encontrar/extraer las anotaciones/comentarios en función de un criterio de búsqueda. En ese caso, el criterio de búsqueda es "0025", como puedes ver en la sección Criterio Avanzado . Esto es posible ya que con el botón Opciones... puedo especificar buscar solo dentro de los comentarios. Debajo de las opciones de búsqueda, están los resultados. Es realmente poderoso ya que puedo navegar a través de cada comentario encontrado por el motor de búsqueda.

Ahora, me gustaría recopilar o resumir esos resultados, esos comentarios, comentarios que provienen de muchos archivos pdf (cada línea en negrita en la ventana de resultados es un archivo pdf), en un solo archivo pdf. Es esta segunda operación la que XChange Editor no puede realizar. Y para el caso, ninguno de los editores de pdf existentes que probé es capaz de hacer eso. Claro, el editor XChange puede resumir los comentarios de un solo archivo según los criterios de clasificación (tipo, autor, fecha, etc.) pero no según los criterios de búsqueda (como "0025" en mi ejemplo).

Entonces, si se me permite, repetiré mi pregunta:

¿Existe un software PDF capaz de encontrar, extraer, seleccionar y luego resumir las anotaciones/comentarios de un montón de archivos PDF en función de un criterio de búsqueda , por ejemplo, el nombre de un proyecto como "0025" en mi caso? Si se trata de soluciones pagas, estoy dispuesto a pagar hasta 10 $ al año.

Muchas gracias,

francois

Izzy cambia mi publicación. ¿Es legal?
Sí, en este sitio todos son bienvenidos a mejorar las publicaciones de otras personas, siempre y cuando el espíritu de la pregunta siga presente y no se pierda la información requerida. Pero en este caso en particular, no estoy seguro de por qué @Izzy eliminó la información del presupuesto, que parecía relevante.
@NicolasRaoul No lo eliminé , lo agregué (hechos integrados de los comentarios). Fue el propio Francois quien lo volvió a quitar. Así que tienes que preguntarle por qué lo hizo, ya que estoy de acuerdo contigo en que eso es relevante. // Francois: Como dijo Nicolás, nos ayudamos mutuamente a mejorar. Los hechos deben estar contenidos en la publicación de la pregunta, ya que se pierden en los comentarios. Acerca de la legalidad: aceptaste explícitamente colocar tu contenido bajo una licencia CC, consulta la parte inferior de esta página ;)
PD: Izzy lo hizo de nuevo. Izzy y Nicolas son moderadores aquí (como puede ver por el ♦ adjunto a sus nicks), por lo que prestan especial atención a la calidad de este sitio y, como todos los miembros de la comunidad aquí, tratan de ayudar especialmente a los recién llegados para que sus preguntas tengan la mejores posibilidades de buenas respuestas. Es por eso que los detalles esenciales deben ser visibles;)
@Izzy y Raoul Lo siento, no entendí tu forma de hacer las cosas en StackExchange. Este no es un enfoque estándar para la mayoría de los foros de discusión. Aún así, si me puedes ayudar de todos modos.
"Este no es un enfoque estándar para la mayoría de los foros de discusión". Seguramente no. Este es un sitio de preguntas y respuestas, no un foro :) Las discusiones tienen lugar en nuestra sala de chat (10 representantes más, y también puede usarla). En el sitio principal, tenemos preguntas y respuestas, pero no discusiones. Los comentarios son para aclaración, por lo que la esencia se integra preferentemente con la resp. pregunta respuesta. Nuestro recorrido explica algo de esto.

Respuestas (1)

Zotero con pdftotextherramientas (se instala automáticamente a pedido) puede realizar búsquedas de texto completo, extraer anotaciones, TOC y generar informes en una enorme base de datos con miles de archivos PDF.