Escaneo de archivo de varios medios, ¿qué debo buscar en un escáner?

TL, DR: ¿Qué debo buscar en un escáner para digitalizar fotografías de 10 a 80 años y varios otros medios como importancia secundaria? ¿Tiene algún consejo teórico o práctico, o referencias que ofrecer? Si se requieren más detalles, por favor hágamelo saber.

Detalles de los medios

Tengo una pequeña colección (aproximadamente 200) de fotografías que creo que serían valiosas para aquellos interesados ​​en la historia y la arquitectura de Johannesburgo . Fueron tomadas por mi abuelo y mi abuela entre 1950 y 1970. Hay varias otras fotografías que fueron tomadas antes de eso, creo que la más antigua es de mediados de la década de 1940, y algunas que pueden haber sido de finales de la década de 1930, del fotógrafo. probablemente desconocido. Esto es lo que más me interesa digitalizar y poner en línea. Muchos de los edificios ya no existen y fueron tomados por la razón explícita de documentar la arquitectura y los edificios, así como la tierra que ahora se ha desarrollado.

También tengo varias fotografías que son mucho más recientes, pero principalmente de interés personal. También hay varios documentos, libros, recortes de periódicos y otros medios impresos que no tienen derechos de autor pero que actualmente no están disponibles en línea. Algunos de los libros contienen acuarelas pintadas a mano. También hay pinturas de acuarela en sí mismas.

Desafortunadamente, creo que ya no tenemos los negativos, ni muchas de las diapositivas que también se produjeron, pero si aparece alguna, también me gustaría archivarlas digitalmente.

Derechos de autor

Todo lo que está fuera de los derechos de autor, o que está dentro de nuestros derechos legales, estamos planeando cargarlo en un sitio de recopilación o intercambio de imágenes relevante. (Salvo aquellos de interés puramente personal).

Limitaciones personales/presupuestarias/de compensación de tiempo

No estoy realmente preocupado por el tiempo o la participación manual en el proceso de escaneo, mi principal preocupación es la precisión y la calidad de los escaneos. Técnicamente, no hay presupuesto disponible para esto, por lo que nuestro objetivo es mantener los costos bajos, pero no deseamos escatimar por completo y entrar en esto a ciegas. Es muy poco probable que archivar correctamente los originales sea una opción, y parte de ellos se enviarán a otros miembros de la familia.

He pasado un poco de tiempo investigando mis opciones, pero todo esto está muy lejos de mi área de experiencia teórica o práctica y obtener el conocimiento teórico no es algo que tendré tiempo de hacer por un tiempo.

No tengo habilidades de edición de imágenes, ni nada para administrar la calibración del color. Es muy preferible que el escáner tenga una buena compatibilidad con Linux y que cualquier software esté disponible también para Linux.

Almacenamiento

El almacenamiento de los escaneos resultantes que todavía tienen derechos de autor o son solo de interés personal es algo que está dentro de mi conjunto de habilidades, el tamaño del archivo no es una gran preocupación en este momento. (Para aquellos interesados ​​en los detalles, actualmente estoy basando el almacenamiento en un microservidor HP N40L que ejecuta Ubuntu 14.04, un UPS de larga duración y ZFS como el sistema de archivos en una configuración espejo o RAIDZ. Para la visualización y navegación local, estoy indeciso , aunque podría rodar el mío. A largo plazo, deseo tener almacenamiento en cinta).

Largo recorrido: Blu Ray en un estuche cerrado en la oscuridad. Para el HP N40L vaya a RAIDZ2 o espejo, no confíe en RAIDZ. El resto lo dejo a los expertos en las demás materias.
Por extraño que parezca, todavía dudo un poco en confiar en los medios ópticos. Sin embargo, no está fuera de discusión. Este artículo explica exactamente por qué no ejecutaría RAIDZ simple ni RAID4/5. Tampoco ejecutaré un lote uniforme de discos. Mantengo un ojo en SMART, y 'estreso' las pruebas de manejo entre cualquier forma de reutilización. Es probable que refleje, según el resultado de la sobrecarga del procesador y la disponibilidad del disco o del controlador.
Tengo CDs y DVDs ópticos legibles de hace >15 años... Compre Verbatim y guárdelos en la oscuridad, en cajas selladas o de cartón, durarán mucho. Y BD debería durar más que los otros tipos, ya que la longitud de onda es más corta y un porcentaje mucho menor de la luz que encuentres podría dañarlos. Y la fabricación ha sido actualizada. BD > DVD > CD.
Con respecto a los discos duros, simplemente puede escalonarlos: compre uno, déjelo funcionando un mes, agregue un segundo, déjelos un mes y así sucesivamente. Cuando agregue el último, formatee el grupo ZFS y comience a poner datos en él. Y use smartd.conf para enviarse correos electrónicos cuando cambien atributos específicos.
El soporte de escáner en Linux es un negocio complicado que involucra blobs binarios para los escáneres más recientes, o lo era hace unos años, de todos modos. Antes de comprar uno basado en que se menciona como "compatible" en alguna parte, es posible que desee buscar la experiencia de otros con ese modelo en el sabor específico con el que planea usarlo... el empaquetado de controladores propietarios es algo que las distribuciones tienen enfoques muy variados a.
@OlafM Gracias, lo tendré en cuenta. He tenido más problemas con las unidades del mismo período de tiempo, en lugar del tiempo que han estado en uso.
@junkyardsparkle Esa es mi práctica general cuando se trata de Linux y hardware. Los fabricantes que afirman que el soporte es a veces una broma en el mejor de los casos, puedo hacer funcionar una máquina Windows separada si es necesario, ya sea 7 o XP. No me importan los trucos, ni los parches, ni nada por el estilo, siempre y cuando funcione.

Respuestas (1)

Cualquier escáner funcionará siempre que pueda escanear transparencias y fotografías. No he ejecutado Linux desde los días de las primeras distribuciones de Red Hat. No puedo ayudar con el software de escaneo. En el mundo que no es de Linux, sugeriría algo profesional en la forma de escanear software como Silverfast. Vuescan también es una excelente pieza de software y la versión 9.4.32 debería ejecutarse en Ubuntu.

Mire aquí: http://sysads.co.uk/2014/05/install-vuescan-9-4-32-ubuntu-linux-mint/

Debería encontrar una lista de escáneres compatibles y puede elegir el mejor de ellos observando su resolución nativa y si proporcionan o no una cubierta de escáner de transparencias con el dispositivo.

En términos de resolución de escaneado, no necesitará más de 300 ppp si desea imprimir las imágenes fotográficas en su tamaño original y la visualización web no requerirá más de 100 ppp. Guarde los archivos en un formato que sea transferible y utilizable más adelante. Evite los archivos .jpg porque cada guardado destruirá un poco más del archivo y se deteriorarán más allá de su uso después de varios guardados.

Sugiera un escáner que pueda escanear de forma nativa hasta 2400 ppp. Más está bien, pero crea archivos enormes que no necesita. Otro formato de almacenamiento que puede considerar es PNG. El soporte de canal alfa (transparente) y los archivos de 16 bits sin pérdidas son posibles. No es compatible con CMYK, por lo que la impresión de archivos puede ser problemática.

Mi preferencia sería guardar archivos con la mayor cantidad de información posible, por lo que probablemente significaría un formato de archivo sin pérdidas como .tif y un formato de archivo de 16 bits para que la reelaboración del archivo sea lo menos dolorosa posible. Significaría que se usa más espacio de almacenamiento de archivos aunque la compresión LZW está disponible. Considere un escáner que pueda guardar el formato de archivo RAW porque no habría pérdida de información y siempre existiría la oportunidad de volver a trabajar en el archivo.

En cuanto a RAID, sospecho que es mucho mejor evitarlo. Si usa un solo disco, es menos probable que falle que si usa varios discos porque está aumentando efectivamente el riesgo de falla con cada disco agregado a la solución de almacenamiento. Optaría por un solo disco, lo copiaría y almacenaría la copia fuera del sitio. Una vez usé una unidad de cinta muy grande y costosa de 20 GiB de capacidad. Fue lento, secuencial y cuando falló, no pude recuperar ninguno de mis datos.

Olvidé agregar que la mayor parte de su escaneo posterior a la transferencia de archivos en Linux probablemente se realizaría a través del software GIMP (el simulacro de Photoshop). No lo he usado durante 10 años y la última vez que lo miré no podía usar ni procesar archivos de 16 bits. Eso puede haber cambiado, pero vale la pena tenerlo en cuenta si va a mantener el máximo detalle en sus imágenes escaneadas.

Espero que esto ayude