Software basado en la web para crear una base de datos de documentos con capacidad de búsqueda con administración de usuarios

Estoy buscando una solución basada en web que me permita ejecutar una base de datos basada en web para (principalmente) documentos PDF (más quizás algunos documentos de MS Office). Busqué en Google "administración de documentos" (y, a falta de una etiqueta mejor, etiqueté esta pregunta en consecuencia), pero eso no es todo, ya que no necesito la mayoría de las funciones que generalmente implica el término sistema de administración de documentos, a saber allí No hay necesidad de colaboración, calendarios, control de versiones, flujos de trabajo, etc. Más bien, necesito algo que cree un índice de búsqueda muy bueno a partir de los documentos para permitir que los usuarios autenticados encuentren y descarguen información relevante.

Para dar una breve lista de lo que estoy buscando:

  • solución completamente basada en web
  • algo con soporte a largo plazo
  • gestión integrada de usuarios (acceso solo para usuarios autenticados)
  • debe admitir más de 1000 usuarios ("usuarios" significa personas que buscan en la base de datos, más quizás unas pocas docenas de personas que cargan documentos)
  • los costos de software comercial/licencia están bien (el presupuesto para gastos de funcionamiento es superior a los miles por año. Somos conscientes de que habrá un costo adicional para la implementación)
  • comenzamos con unos 1000 documentos (ya que los archivos no se migrarán de la base de datos actual), se agregarán documentos a una tasa de aproximadamente 1000 por año
  • algunos de los documentos contienen información confidencial, por lo que estamos buscando algo con un buen historial en materia de seguridad
  • el software debe ser capaz de indexar documentos pdf y permitir metadatos agregados manualmente
  • debemos poder ordenar los documentos por temas y otorgar derechos de acceso según el tema (la búsqueda debe devolver solo los documentos a los que el usuario tiene permiso para acceder/descargar)
  • debe usar un sistema de plantilla que permita a nuestros desarrolladores frontend integrar nuestro CI (además, debe permitir un diseño receptivo/compatible con dispositivos móviles)
  • los usuarios deberían poder guardar sus búsquedas y recibir una notificación si un documento recién indexado coincide con una búsqueda guardada
  • página de resultados de búsqueda estructurada de forma sencilla con una muy buena búsqueda de texto completo que muestra el título y extractos de los documentos

El último punto es bastante importante para nosotros: realizamos una encuesta en la encarnación actual de la base de datos y recibimos infinitas variaciones de "Quiero una interfaz simple similar a Google con un solo campo de texto, los filtros de búsqueda adicionales deberían ser el último recurso y no es algo que tenga que usar regularmente". Sin embargo, parece que los paquetes prediseñados suelen ofrecer una estructura más parecida a un portal/intranet. En el pasado, creamos soluciones similares sobre paquetes de código abierto (Drupal, etc.), pero nuestra experiencia con la seguridad y el soporte a largo plazo se han mezclado al menos, por lo que preferimos comprar algo con un historial comprobado. (si esa es la expresión correcta).

Respuestas (1)

Alfresco es probablemente lo mejor para este escenario.

Extractos de búsqueda de Alfresco Share

  • Completamente basado en la web: Sí, ya sea SaaS o en el servidor de su empresa. También hay disponibles protocolos adicionales como CMIS en caso de que los necesite.
  • Soporte a largo plazo de hasta 5 años, disponible directamente de la empresa Alfresco o de terceros
  • Gestión integrada de usuarios (acceso solo para usuarios autenticados): Sí
  • Alfresco se utiliza para grandes proyectos, por ejemplo, conozco un proyecto con 100.000 usuarios.
  • Código abierto, pago por soporte
  • Un millón de documentos no es un problema
  • Gran historial de seguridad, los parches están disponibles muy rápidamente. Una solución basada en Alfresco ha sido certificada por el Departamento de Defensa 5015
  • Indexa documentos PDF y muchos otros tipos de archivos, puede definir su propio esquema de metadatos y editar metadatos a través de la interfaz web
  • Puede organizar documentos en carpetas y otorgar derechos de acceso según la carpeta. La búsqueda devolverá solo los documentos que el usuario tiene permiso para descargar
  • Puedes desarrollar nuevos temas .
  • La interfaz de usuario web no es especialmente compatible con dispositivos móviles, pero hay una aplicación que le permite hacer lo que quiera en una experiencia móvil nativa.
  • Los usuarios pueden guardar sus búsquedas . Los nuevos resultados aparecerán en su tablero.
  • Las páginas de resultados de búsqueda muestran extractos de coincidencias si usa este parche , no es muy fácil de configurar pero es factible.

Alfresco es utilizado por muchas grandes empresas que manejan una gran cantidad de documentos y no pueden tolerar ningún fallo de seguridad: http://www.alfresco.com/customers

+1 por una muy buena respuesta (especialmente porque nuestro requisito de "móvil" se evaporó durante la última reunión). Esperaré unos días (y me informaré sobre Alfresco) y, si no aparece nada más interesante, lo aceptaré. ¡Gracias!