Estamos tratando de configurar un indexador de documentos basado en la web que admita tipos de archivos pdf, doc, docx, txt que no requieran un procedimiento de configuración complicado.
Hemos tratado:
En nuestra PC/servidor ya hemos configurado un servidor web apache para SVN y trac y además: python, PHP, mysql.
Idealmente, queremos algo que funcione listo para usar con pdf/docs... ¿existe tal herramienta?
Sphider Plus lo hará bastante bien para eso. El SPhider original también podría funcionar, pero IIRC no admite automáticamente la indexación de archivos doc/docx. Los he encontrado geniales a los dos. Son más o menos lo mismo, excepto que Sphider Plus es mil veces mejor: piense en el original como una versión 'lite'. Esto es realmente un rec. para Sphider plus y ese es el conjunto de características del que hablaré principalmente, la única razón por la que menciono el original es que es un artículo gratuito/de donación, mientras que Sphider Plus cuesta 25 EUR.
Como ya tiene una pila WAMP, la configuración será bastante simple. Asegúrese de que la lista de directorios esté habilitada para que pueda completar la indexación de archivos que no tienen enlaces entre ellos y configure Apache para alojar los archivos deseados, con el archivo VirtualHosts (que se ubicará en algún lugar como este: Apache<versionnumber>\conf\extra\httpd-vhosts.conf
).
El código que desee dependerá de los archivos que desee que se puedan buscar; Sugeriría algo como esto (solo cambie las rutas según lo desee/requerido): - Me referiré a esto a lo largo de estas instrucciones, pero en realidad son solo ejemplos.
<VirtualHost *:80>
DocumentRoot "C:/Users/Nick/Desktop"
ServerName www.desktop.loc
ServerAlias desktop.loc
<Directory "C:/Users/Nick/Desktop">
Options Indexes FollowSymLinks
AllowOverride All
Order allow,deny
Allow from all
</Directory>
</VirtualHost>
<VirtualHost *:80>
DocumentRoot "C:/Users/Nick/Pictures"
ServerName www.pictures.loc
ServerAlias pictures.loc
<Directory "C:/Users/Nick/Pictures">
Options Indexes FollowSymLinks
AllowOverride All
Order allow,deny
Allow from all
</Directory>
</VirtualHost>
y agréguelo a los archivos de host de su sistema operativo:
127.0.0.1 desktop.loc
127.0.0.1 www.desktop.loc
127.0.0.1 pictures.loc
127.0.0.1 www.pictures.loc
Luego, instalar Sphider - Plus es probablemente mejor, ya que ha configurado fácilmente la reindexación automática y admite más tipos de archivos. Probablemente quiera crear una nueva ubicación de vhost search.loc
o algo para facilitar el acceso. Es posible que desee tenerlos detrás de un inicio de sesión de htaccess pero accesibles en la web y localmente, o solo dentro de su LAN. Mientras sea localhost solo, básicamente no hay riesgo de seguridad; Tan pronto como esté abierto, deberá considerar los riesgos seguros y tomar medidas (como un requisito de inicio de sesión seguro) para mitigarlos. Por supuesto, para tenerlo más allá de su LAN, deberá acceder a él por IP, que en la mayoría de los ISP cambia regularmente, u obtener un nombre de dominio y configurar DNS dinámico si es necesario.
A continuación, agregue las ubicaciones picture.loc y desktop.loc al índice de Sphider; tomará un tiempo dependiendo de la cantidad de archivos, etc., entonces está listo para comenzar: D
Características:
Una solución radical es utilizar NemakiWare .
Formatos admitidos: pdf, doc, docx, txt, muchos otros.
Gratis, de código abierto.
Descargo de responsabilidad: mi empresa fabrica tanto NemakiWare como CmisSync. Ambos gratuitos y de código abierto.
Nicolás Raúl
código_forraje
Nicolás Raúl
código_forraje