Estoy buscando un método para escanear más de 6 millones de imágenes para un gran archivo digital (conversión de todo tipo de tamaños a un dpi/resolución). Obviamente, las horas de trabajo involucradas hacen que esto sea una gran empresa y me pregunto si existe algo así como un escáner automatizado a escala industrial, es decir, apila una pila de fotos en una máquina y las escanea en el disco hasta que esté listo. , solo necesita ser recargado de vez en cuando.
¿Alguien se ha encontrado alguna vez con algo así?
ACTUALIZAR
Para responder a las preguntas que han surgido: no se utilizará papel, esta es una foto solo para archivo. Resolución: 600 ppp máx., escaneos a color. Nada demasiado grande, supongo que no habría mucho más de $20-50k disponibles para el sistema.
Hay una serie de detalles importantes que faltan en su pregunta:
Que resolucion requieres?
Color o blanco y negro?
¿El escáner tiene que ser capaz de manejar una combinación de tamaños simultáneamente, o puede ordenarlos con anticipación para que todas las fotos en una pila determinada sean iguales? (Los alimentadores de hojas suelen funcionar mejor cuando las hojas tienen aproximadamente el mismo tamaño).
Hay muchos escáneres de alimentación automática de alta capacidad capaces de escanear en blanco y negro o en color hasta 600 ppp y 75, 100 o incluso 120 páginas por minuto. Aquí hay uno , por ejemplo. Si su proyecto se ajusta a los parámetros de lo que pueden hacer, no importa mucho si se llaman "escáneres de documentos" o "escáneres de fotos".
Si planea escanear 6 millones de fotos, querrá catalogarlas de alguna manera. Si las fotos están actualmente en algún tipo de orden, puede ser suficiente conservar el orden cuando las escanee y darle a cada una un número de serie para que pueda encontrarlas más tarde. Por otro lado, si hay otros metadatos involucrados, tendrá que encontrar alguna forma de adjuntar esos datos a la foto correcta. Encontrar un flujo de trabajo eficiente que minimice los errores y le permita escanear suficientes fotos para que pueda terminar en un tiempo razonable puede ser difícil. (Una vez trabajé en un proyecto que implicaba escanear decenas de miles de páginas y el problema del flujo de trabajo era probablemente más difícil que cualquier problema técnico).
Déjame responder a tu pregunta directa primero:
La gente de imágenes de documentos ha estado haciendo esto durante mucho tiempo. Por lo general, se utilizan para grandes proyectos de escaneo de imágenes, como el procesamiento de formularios del censo de EE. UU. Nunca he visto uno para fotos, pero eso es solo una diferencia en la densidad de píxeles; todo lo demás sería igual.
Estos son increíblemente caros de comprar, y son un dolor real en la parte trasera para seguir funcionando. El gran problema es el manejo del papel. El papel tiende a pegarse cuando está demasiado húmedo, demasiado seco o demasiado arrugado.
Su idea de cargar una gran pila en una tolva, presionar un botón y regresar en una hora para verlos todos procesados es un sueño. Nunca sucede. Los atascos de papel son una realidad.
Pero parece estar sugiriendo que el punto de partida es digital, no en papel. ¿Por qué demonios querrías tener papel en el medio? Simplemente obtenga algún software para convertir cualquier formato que tenga al que desee. El software es simple y directo. El manejo del papel es un gran problema.
Además, los escáneres comerciales como los que usamos para el Censo son realmente caros, como en seis y siete cifras para comprar uno. Luego agregue operadores capacitados, mantenimiento, etc.
Espera, ¿estás diciendo que tus imágenes ya son digitales pero solo en la resolución incorrecta? En ese caso, realmente debería omitir la parte de impresión para volver a escanear y usar directamente, por ejemplo , la conversión de ImageMagick, que puede convertir fácilmente todas las imágenes por lotes a la resolución deseada.
Suponiendo que está utilizando Linux y todas las imágenes residen en un directorio original
(incluidos los subdirectorios), haga algo como esto para convertir todo a 300 ppp:
cd original
mkdir ../converted
find -type f -exec sh -c '
convert -units PixelsPerInch $0 -density 300 ../converted/$0
' {} ';'
(Eso PixelsPerInch
es necesario de acuerdo con esta respuesta de unix.SE , el find -exec sh
truco se debe a esta respuesta y también administra los espacios en los nombres de archivo). Sin embargo, pruébelo primero en un pequeño subconjunto para ver si funciona de la manera prevista.
De todos modos, esto le ahorrará alrededor del 99,9999% del tiempo, dinero, papel y cerebro desperdiciados de otra manera ;-)
Tobias Kienzler
mattdm
Pat Farrell
mattdm
Pat Farrell
mattdm
mattdm
Pat Farrell
mattdm
Tobias Kienzler
Tobias Kienzler
Dibujó
Dibujó