¿Escáner fotográfico automatizado a escala industrial?

Estoy buscando un método para escanear más de 6 millones de imágenes para un gran archivo digital (conversión de todo tipo de tamaños a un dpi/resolución). Obviamente, las horas de trabajo involucradas hacen que esto sea una gran empresa y me pregunto si existe algo así como un escáner automatizado a escala industrial, es decir, apila una pila de fotos en una máquina y las escanea en el disco hasta que esté listo. , solo necesita ser recargado de vez en cuando.

¿Alguien se ha encontrado alguna vez con algo así?

ACTUALIZAR

Para responder a las preguntas que han surgido: no se utilizará papel, esta es una foto solo para archivo. Resolución: 600 ppp máx., escaneos a color. Nada demasiado grande, supongo que no habría mucho más de $20-50k disponibles para el sistema.

Tal vez me apresuré un poco al deducir esto de la respuesta de Pat Farrell, ya que su pregunta no lo hace tan obvio, entonces: ¿ las imágenes ya son digitales pero solo necesitan convertirse, o solo existen como copias impresas? En el primer caso, deberías echar un vistazo a thedailywtf.com/Articles/Web_0_0x2e_1.aspx ...
No entiendo de dónde se sacaría la idea de esta pregunta de que las imágenes ya están en formato digital.
Si no hay papel, ¿qué vas a "escanear"? Creo que estás usando una terminología no estándar aquí. Para su presupuesto, si no puede encontrar un software (como ImageMagick) para hacerlo, no podrá hacerlo. 833 horas de mano de obra arruinarán su presupuesto, sin la máquina 32K.
@Pat: las fotos están en papel fotográfico. No hay intención de escanear y reimprimir en algún papel intermedio, como sugiere en su respuesta. Sin embargo, no hay ningún indicio de eso en la pregunta original que puedo ver. ¿Es la línea "conversión de todos los tamaños" lo que te confunde? Las fotos físicas vienen en varios tamaños.
No, su "enorme archivo digital" que indica que están en el disco. Siendo realistas, esto es imposible de hacer dentro de su presupuesto si @alex realmente quiere colocar cada una de las 6 millones de fotos en un escáner. El presupuesto actual para escanear a gran escala es de unos diez centavos por hoja de papel. Por lo tanto, $600K es un presupuesto, no 20K.
Es " para un gran archivo digital". No de . Lo siento, pero realmente no puedo ver cómo eso es ambiguo.
Lo cual es desafortunado porque resta valor a su punto legítimo sobre el precio y el alcance.
Wow, cierto @matt, lo leí mal. Sigo pensando que esto es imposible. Necesita una aclaración de alex sobre por qué espera que esto funcione.
@Pat Eso se ve muy malhumorado de mi parte en retrospectiva. No sé, teniendo un mal día aquí o algo así. ¡Lo siento!
Para cualquier persona en el futuro que realmente intente convertir imágenes ya digitales a través de la impresión para volver a escanear (@Pat y yo entendimos accidentalmente que la pregunta implicaba esto), use una herramienta digital en su lugar .
Seguro que la NSA te puede ayudar con esto... ;-)
Hmm... pensándolo bien, ¡quizás seas la NSA! ;-)

Respuestas (3)

Hay una serie de detalles importantes que faltan en su pregunta:

  • Que resolucion requieres?

  • Color o blanco y negro?

  • ¿El escáner tiene que ser capaz de manejar una combinación de tamaños simultáneamente, o puede ordenarlos con anticipación para que todas las fotos en una pila determinada sean iguales? (Los alimentadores de hojas suelen funcionar mejor cuando las hojas tienen aproximadamente el mismo tamaño).

Hay muchos escáneres de alimentación automática de alta capacidad capaces de escanear en blanco y negro o en color hasta 600 ppp y 75, 100 o incluso 120 páginas por minuto. Aquí hay uno , por ejemplo. Si su proyecto se ajusta a los parámetros de lo que pueden hacer, no importa mucho si se llaman "escáneres de documentos" o "escáneres de fotos".

Si planea escanear 6 millones de fotos, querrá catalogarlas de alguna manera. Si las fotos están actualmente en algún tipo de orden, puede ser suficiente conservar el orden cuando las escanee y darle a cada una un número de serie para que pueda encontrarlas más tarde. Por otro lado, si hay otros metadatos involucrados, tendrá que encontrar alguna forma de adjuntar esos datos a la foto correcta. Encontrar un flujo de trabajo eficiente que minimice los errores y le permita escanear suficientes fotos para que pueda terminar en un tiempo razonable puede ser difícil. (Una vez trabajé en un proyecto que implicaba escanear decenas de miles de páginas y el problema del flujo de trabajo era probablemente más difícil que cualquier problema técnico).

Ese, que cuesta solo $ 32,000, tiene una capacidad de hasta 120 páginas / minuto. Eso no significa que de hecho escaneará 120 páginas reales por minuto, o 240 en dos minutos o 360 en tres. En teoría, podría hacer 7200 por hora. Nunca va a pasar. Pero si pudiera, aún tomaría 833 horas. Esto es cerca de medio año a las 8 horas del día. @caleb tiene razón, el flujo de trabajo, la gestión del papel y todo tipo de otras cosas son mucho más importantes que escanear.
Hay máquinas mucho más baratas (por ejemplo, $ 7000) con tasas de escaneo algo más bajas (60 o 75 ppm). Y escanear a resoluciones más bajas generalmente permitirá velocidades más rápidas. Siempre puede escalar la tasa de escaneo agregando más escáneres. Por otra parte, debe tener un lugar para colocar todos esos datos, una forma de hacer una copia de seguridad y algún medio para encontrar el que desea más tarde.
Tendría mucho cuidado al escanear fotografías en escáneres de documentos regulares. Tengo un escáner de documentos y está perfectamente bien para documentos: Fujitsu ScanSnap s1500, sin embargo, algunas personas han mencionado marcas en las fotos que pasaron por el escáner. Dado cómo funciona, puedo imaginar fácilmente que esto suceda (no he probado con fotos, solo con papel fino). A menos que un escáner esté diseñado para escanear fotografías, tendría cuidado al usarlo para la tarea (a menos que la impresión sea desechable, o use una hoja de soporte transparente).
@DetlevCM ¡Este es un punto muy importante! Cuando escaneé algunas fotografías en casa, el resultado no fue demasiado satisfactorio; creo que se debe a una estructura de superficie que se supone que crea el efecto de superficie fotográfica. #Alex Sugiero que antes de comprar algo que valga varios dígitos, pídele al vendedor que te muestre cómo funciona un lote de muestra, con respecto al tiempo y la calidad de las fotografías.
Solo para que sepa las matemáticas: incluso con un escáner de 120 páginas/min y suponiendo un progreso impecable mientras funciona las 24 horas del día, los 7 días de la semana, aún tomará al menos un mes completo. Y lo más probable es que haya fallas y atascos. Entonces, @Alex debería considerar a) obtener múltiples escáneres o b) subcontratar esto a otros 10-100 para que haya una posibilidad real de que esto realmente se haga dentro de uno o dos meses .
@TobiasKienzler Es posible que esté leyendo demasiado en la pregunta. No creo que el OP haya dicho nada sobre un horario. Él o ella puede tener un mes o un año o más para terminar la tarea, y el esfuerzo y el equipo obviamente deberán escalarse para que coincidan con el requisito que sea. Una pregunta más importante es el presupuesto: ¿cuántos escáneres de alta velocidad y alta capacidad gastará en el proceso de escanear 6 millones de documentos, cuánto cuesta operarlos y mantenerlos, y son suficientes $20-50K para cubrir eso? El OP tendrá que hacer ese cálculo por sí mismo.
@Caleb Cierto, antes de considerar un cronograma, se debe evaluar la factibilidad debido al presupuesto...

Déjame responder a tu pregunta directa primero:

La gente de imágenes de documentos ha estado haciendo esto durante mucho tiempo. Por lo general, se utilizan para grandes proyectos de escaneo de imágenes, como el procesamiento de formularios del censo de EE. UU. Nunca he visto uno para fotos, pero eso es solo una diferencia en la densidad de píxeles; todo lo demás sería igual.

Estos son increíblemente caros de comprar, y son un dolor real en la parte trasera para seguir funcionando. El gran problema es el manejo del papel. El papel tiende a pegarse cuando está demasiado húmedo, demasiado seco o demasiado arrugado.

Su idea de cargar una gran pila en una tolva, presionar un botón y regresar en una hora para verlos todos procesados ​​es un sueño. Nunca sucede. Los atascos de papel son una realidad.

Pero parece estar sugiriendo que el punto de partida es digital, no en papel. ¿Por qué demonios querrías tener papel en el medio? Simplemente obtenga algún software para convertir cualquier formato que tenga al que desee. El software es simple y directo. El manejo del papel es un gran problema.

Además, los escáneres comerciales como los que usamos para el Censo son realmente caros, como en seis y siete cifras para comprar uno. Luego agregue operadores capacitados, mantenimiento, etc.

+1 - Deberías poner más énfasis en la locura de imprimir 6 MILLONES (!) De imágenes solo para volver a escanearlas
?? Son fotos que necesita escanear, no es necesario imprimirlas, ya están impresas.
Ahora que hemos editado la pregunta, entiendo mejor. Pero todavía dudo que el alcance de esto sea razonable. 6 millones de fotos llevará años escanear.

Espera, ¿estás diciendo que tus imágenes ya son digitales pero solo en la resolución incorrecta? En ese caso, realmente debería omitir la parte de impresión para volver a escanear y usar directamente, por ejemplo , la conversión de ImageMagick, que puede convertir fácilmente todas las imágenes por lotes a la resolución deseada.

Suponiendo que está utilizando Linux y todas las imágenes residen en un directorio original(incluidos los subdirectorios), haga algo como esto para convertir todo a 300 ppp:

cd original
mkdir ../converted
find -type f -exec sh -c '
  convert -units PixelsPerInch $0 -density 300 ../converted/$0
' {} ';'

(Eso PixelsPerInches necesario de acuerdo con esta respuesta de unix.SE , el find -exec shtruco se debe a esta respuesta y también administra los espacios en los nombres de archivo). Sin embargo, pruébelo primero en un pequeño subconjunto para ver si funciona de la manera prevista.

De todos modos, esto le ahorrará alrededor del 99,9999% del tiempo, dinero, papel y cerebro desperdiciados de otra manera ;-)

Espero que el OP tenga imágenes en varios formatos, pero este enfoque es lo que estaba diciendo, incluso si tiene que escribir un software de conversión personalizado, hacerlo como dígitos es mucho mejor que cualquier plan de escaneo. Mi estimación es que su 99,999% más rápido es conservador y será mucho más rápido incluso que eso.
El OP no dice nada sobre "imágenes en varios formatos", solo fotos en todo tipo de tamaños.
@mattdm Leí la pregunta, luego la respuesta de Pat y mi subconsciente recordó solo la parte del "archivo digital enorme" en la pregunta en lugar de " para un archivo digital enorme". Por eso, después de publicar esto, volví a leer la pregunta y pedí aclaración _ Dejaré la respuesta aquí en caso de que alguien más intente realmente lo que Pat y yo pensamos primero que era la intención.