Herramienta de indexación, procesamiento y gestión en general de documentos digitalizados

Actualmente estoy tratando de cambiar de archivar y almacenar mis documentos en forma física a uno digitalizado.

He escaneado todos mis documentos. El escaneo en sí se almacena como un archivo de imagen JPG de 300 ppp.

Estoy buscando una herramienta que pueda procesar esas imágenes para reconocer el texto en ellas. Además, debe proporcionar algún tipo de funcionalidad de "búsqueda" para facilitar la búsqueda de documentos.

Consideraría lo siguiente como 'agradable tener':

  • Análisis de contexto (reconocimiento de documentos de varias partes)
  • agrupación automática (por ejemplo, por fecha si la fecha está impresa en el documento)
  • corrección de imagen (por ejemplo, si la imagen está al revés)
  • capaz de escanear más tipos de documentos (por ejemplo, pdf, png, ..)

Planeo ejecutar esto en un servidor Windows 2016 o en un sistema Windows 10 Pro. Para mí, no es importante si se puede acceder a la aplicación a través de una interfaz web o una aplicación cliente. Poder acceder a los archivos en el móvil al proporcionar un punto final para conectarse también es una buena ventaja.

Estoy dispuesto a pagar un precio único de hasta $ 100, ... gratis es mejor ofc.

¿Alguna sugerencia? ¿Alguna experiencia?

Respuestas (1)

Alfresco puede hacer esto, en realidad lo configuré para un caso de uso similar hace unos años.

  1. Instale Alfresco 2 Run y ​​utilícelo un poco para comprender lo que hace. Básicamente, le permite cargar documentos y organizarlos usando carpetas/categorías/etiquetas/aspectos/metadatos como desee (no tiene que usar todo esto, puede usar solo carpetas y etiquetas, por ejemplo).
  2. Configure OCR siguiendo https://community.alfresco.com/blogs/alfresco-premier-services/2017/10/11/indexing-image-in-alfresco-with-tesseract-ocr
  3. Ahora puede buscar documentos (PNG, BMP, JPEG, GIF, TIFF, PDF) por su contenido de texto OCRed.

Ventana emergente de búsqueda de Alfresco

  • Gratis y de código abierto
  • interfaz web
  • El servidor se ejecuta en Windows/Linux/Mac
  • Desafortunadamente no tiene las características "agradables de tener" que mencionas.
¡Gracias! Estoy seguro de que voy a probarlo y me pondré en contacto contigo, aunque parece prometedor
tbh, no tengo una buena impresión después de intentar trabajar con él durante varias horas sin progresar... crear usuarios funciona pero mostrar sus detalles no. Además, el usuario creado no puede usar la interfaz web (¿problema de permisos?), tratar de eliminar los archivos de muestra que se proporcionan tampoco funcionó correctamente y la carga de archivos también falló; no estoy convencido. tal vez algo 'más limpio'/más delgado?
¿Quiere decir que los usuarios no pueden iniciar sesión? ¿O no pueden ingresar al "sitio" que creaste? Puede configurar los permisos del "sitio" para que todos puedan verlo después de iniciar sesión. Puede eliminar las muestras si inicia sesión como administrador. Puede publicar preguntas de Alfresco en superuser.com :-)
No, el inicio de sesión en sí funciona, pero justo después de que se muestra una pantalla que dice "algo está mal". no se pueden realizar más acciones desde allí. Tuve que eliminar el caché local y volver a iniciar sesión con la cuenta de administrador. Además, la eliminación de los datos de muestra con la cuenta de administrador no funcionó.