Software para buscar a través de archivos (principalmente PDF)

Me gustaría saber si hay algunos proyectos activos de código abierto para desarrollar alternativas a Google Desktop o Regain para Windows 7.

La situación es la siguiente:

  • Tengo una carpeta llena de documentos PDF (organizados en muchas subcarpetas). Hay al menos un documento actualizado o creado todos los días,
  • A menudo necesito buscar algunas palabras y oraciones en estos documentos,
  • La búsqueda de Windows y Agent Ransack son demasiado lentas y sus interfaces no se ajustan a mis necesidades,
  • La interfaz de Regain se adapta a mis necesidades casi a la perfección: escribo mis criterios de búsqueda y obtengo una lista de resultados con una breve descripción general, pero no puedo restringir el perímetro de búsqueda a un directorio específico.
  • La última actualización que se recuperó fue el 30 de julio de 2014; esto me hace preguntarme si está desactualizado o usa componentes obsoletos (y no me gustaría comprometer la seguridad de mi computadora),
  • Busqué en muchos sitios web antes de publicar aquí ( Este tema me llevó a Recuperar).

Aquí hay un ejemplo de resultados de búsqueda con Regain:Recuperar: ejemplo de resultados de búsqueda

Respuestas (3)

Solía ​​usar Recoll y era muy bueno: http://www.lesbonscomptes.com/recoll/ Usa poppler, la conocida biblioteca de PDF.

Los sistemas operativos modernos a menudo tienen funciones de búsqueda de este tipo de forma predeterminada, por ejemplo, Fedora proporciona Nepomuk. Sin embargo, pueden requerir muchos recursos.

¡Gracias! Sin embargo, no mencioné: el software debe ejecutarse en Windows. Actualicé mi publicación para agregar la información que faltaba.
Vaya. Tal vez alguien haga un puerto. Aparentemente, Poppler también está disponible en Windows, por lo que es una cosa menos de qué preocuparse.
Recoll ahora tiene un puerto casi nativo para Windows; vea las noticias en lesbonscomptes.com/recoll ... puede que tenga que compilar desde la fuente. Estén atentos para un instalador, es probable que esté en camino.

De la respuesta de Brian Z .: DocFetcher es una solución multiplataforma bajo la Licencia pública de Eclipse y parece muy poderosa a juzgar por la documentación.

De todos modos, mencionaste que tienes todos los documentos ordenados en carpetas, en ese caso, prueba la función de búsqueda avanzada de Adobe Reader.

Una vez que haya abierto el lector de Adobe, Shift+Ctrl+F debería abrir la interfaz [o puede navegar por Editar (menú) -> Búsqueda avanzada] Noté que para Regain está ejecutando un servidor (debe ser un peso ligero uno, pero sigue siendo un proceso adicional) La captura de pantalla es de la versión Adobe Reader XI.Interfaz de búsqueda avanzada