¿La mejor configuración de cámara para fotografiar texto?

Estoy usando mi S95 para fotografiar documentos de texto (tanto en papel como en microfilm) para OCR. Ya he preguntado sobre los problemas de cómo fotografiar mejor una pantalla de computadora para microfilm, pero he estado pensando en la mejor manera de fotografiar texto para que el texto salga claro y nítido. Estos son mis pensamientos actuales, pero me gustaría escuchar lo que alguien con más experiencia en fotografía que yo tenga que decir:

  1. Estoy usando un número más pequeño de megapíxeles (alrededor de 6-7 MP en lugar del máximo del S95, que es de 10 MP), para que los archivos PDF resultantes no maten mi computadora cuando realmente me desplace por ellos.

  2. Apertura: más baja (p. ej., f/6,3), de modo que si la cámara no está exactamente paralela a la página, el texto permanecerá enfocado

  3. Velocidad de obturación: aquí hay una compensación, porque las bibliotecas generalmente tienen poca luz, por lo que me gustaría reducir la velocidad de obturación y aumentar la exposición, pero sin un trípode, existe la posibilidad de que la cámara se tambalee.

  4. ISO: no estoy muy seguro de cómo esto lo afectaría.

  5. Balance de blancos: de nuevo, no estoy muy seguro.

He estado experimentando con diferentes configuraciones en mi cámara, pero recién estoy aprendiendo sobre fotografía y me gustaría saber si alguien tiene alguna sugerencia sobre cómo fotografiar mejor el texto, de libros o documentos, que sea fácil de leer.

¿Por qué no usar la herramienta adecuada para el trabajo y usar un escáner?
¿Puede dar más detalles sobre su flujo de trabajo? ¿Funciona el OCR en los archivos JPEG o convierte primero los archivos JPEG a PDF? ¿Cómo es la calidad de la impresión? ¿Está envejecido o está todo bastante crujiente?
"¿Por qué no usar la herramienta adecuada para el trabajo y usar un escáner?" - Porque muchos de los documentos con los que trabajo no son escaneables. Son muy frágiles, o la biblioteca no le permite escanear, o la biblioteca cobra costos exorbitantes por escanear más de $ 0.50 por página.
"¿Puedes dar más detalles sobre tu flujo de trabajo?" - Convierto los JPG a PDF y trabajo con ellos en la computadora, imprimiendo algunos para marcarlos.
Me gustaría que se dijera: espero que sus usos respeten adecuadamente los derechos de autor, si es que son relevantes. :) Suponiendo que sí, ¡espero que encuentres tus respuestas!
@lindes - buena decisión
"Espero que sus usos respeten adecuadamente los derechos de autor" - Sí, mi trabajo es con documentos fuera de las restricciones de derechos de autor (soy historiador, principalmente estudio la Europa de finales del siglo XIX)
Esto puede sonar herético, pero leí que las cámaras canon point and shoot son bastante razonables en modo automático. ¿Has probado con fotografías dejando que la cámara piense un poco? es posible que esté satisfecho con los resultados y luego intente mejorarlos según la "opinión experta" de la cámara. no hay nada de malo en intentarlo :)
@ahockley: otra razón para no escanear es que lleva mucho tiempo. Con una DSLR puedo hacer unas 20 páginas por minuto sobre una mesa, pero un escáner rápido usa un alimentador de documentos y cuesta mucho.
En realidad, @josenunoferreira plantea un punto interesante: creo recordar algunas cámaras de apuntar y disparar que incluso tienen un modo específico solo para cosas como esta. Detectaría los bordes de la página, haría la corrección trapezoidal (y/o le advertiría) y crearía imágenes de alto contraste (¿incluso en blanco y negro?), probablemente perfectas para OCR. Ahora, si pudiera recordar qué cámara era... ¿Samsung NV10, tal vez? Yo olvido. Algo que nunca tuve, solo jugué con él una vez. Pero tal vez su cámara tenga ese modo, ¿o una cámara con uno valdría la pena? Por otra parte... diybookscanner.org/forum/viewtopic.php?f=1&t=663
@lindes comprar una cámara específica puede ser un poco exagerado: P también: dpreview.com/news/1008/10081918canonpowershots95.asp#specs No veo ningún modo de escena que se vea así. intente en modo automático, @jason, ¡veamos algunos resultados!
@josenunoferreira sí, probablemente lo sea... pero uno nunca sabe... fue solo un pensamiento como extensión de tu comentario. :) Pero sí, hay otro software por ahí que aparentemente hace buenas conversiones, por lo que probablemente sea mantequilla para usar.

Respuestas (8)

Si su cámara tiene un modo en blanco y negro, lo intentaría para reducir el tiempo de procesamiento posterior. Además, muchos programas de OCR con los que he trabajado funcionan mucho mejor en blanco y negro.

Querrá estar lo más paralelo posible a la página, porque para reducir el movimiento de la cámara cuando se sostiene con la mano, probablemente necesitará su apertura más amplia para maximizar la velocidad de obturación. El pequeño sensor en su s95 debería aumentar su DOF lo suficiente como para abrir la apertura tanto como pueda.

Teniendo en cuenta que solo va a ejecutar esto a través de OCR, suba su ISO a lo que le brinde una exposición adecuada con un movimiento mínimo. Es mucho menos probable que el OCR se queje del ruido adicional que de las letras borrosas.

El balance de blancos, si solo está hablando de texto, debe ser para cualquiera que sea la configuración "interior" de su cámara, pero, francamente, no se preocupe demasiado por eso.

Es posible que sus megapíxeles solo importen si el texto de su documento es increíblemente pequeño y necesitará resolver claramente ese nivel de detalle, pero supongo que 6-7 estará bien para la mayoría de las cosas.

Probablemente quieras decir "perpendicular a la página". Si eres paralelo, será difícil leer el texto. ;-)
@Craig Walker: usó los términos "paralelo" a la página y entendí lo que quería decir, así que no estaba tratando de confundirlo. Sin mencionar que el sensor en sí sería paralelo, al igual que el visor. Solo depende de a qué parte de la cámara haga referencia. El término fue intencional.
Use la mayor cantidad de megapíxeles que pueda, los documentos con OCR son lo que importa y serán relativamente pequeños y siempre que la fuente sea todo texto, no se verá afectado por la resolución de la cámara de todos modos. Uso Abbyy FineReader y funciona mejor en imágenes de mayor resolución (21 MP en lugar de 10 MP, por ejemplo). Así que dispara a 10MP.
me parece bien.
+1 para modo B/N. RGB para el procesamiento de texto está desperdiciando píxeles.

Parece que ya tienes un buen conocimiento de la configuración. El movimiento de la cámara arruinará la legibilidad del texto más que cualquier otra cosa, así que optimizaría eso primero. Si no puede usar un trípode, asegúrese de que la velocidad de obturación sea al menos 1 sobre su distancia focal (equivalente a 35 mm). Alejarse hará esto más fácil. Usa estabilización de imagen si la tienes.

La apertura se puede configurar bastante amplia, solo asegúrese de estar en paralelo con la página. Una apertura amplia ayudará con la velocidad del obturador, de nuevo el desenfoque debido a la apertura amplia no es nada comparado con el desenfoque debido al movimiento de la cámara.

ISO, lo que necesites para conseguir una buena exposición. El ruido no debería afectar la legibilidad hasta que se ponga realmente malo.

Sería preferible disparar con un balance de blancos personalizado basado en el propio papel, pero el software OCR debería ser capaz de hacer frente a un fondo blanquecino.

  1. Supongo que está convirtiendo archivos JPEG a PDF. Recomiendo capturar el máximo y usar un programa para reducir el tamaño a 6-7 MP con nitidez aplicada después de la reducción y antes de la conversión a PDF.

  2. Para aclarar, desea una apertura más estrecha para una profundidad de campo más amplia, que es un número f-stop más alto. (por ejemplo, desea f/8 en lugar de f/2). Con el texto para facilitar la lectura, intente que la cámara apunte lo más perpendicular posible para que no tenga que preocuparse por la profundidad de campo. Es una buena idea detenerse un poco desde la apertura total para reducir las aberraciones como CA que verá con texto en negro sobre blanco. Cuanto más cerca esté del papel, menor será la profundidad de campo.

  3. Esto probablemente tendrá el mayor efecto en la legibilidad si está agarrado de la mano. Si se sujeta con la mano, desea seleccionar una velocidad de obturación que sea más rápida que 1/(distancia focal equivalente a 35 mm), o incluso más rápida. Esto depende de la configuración de zoom que esté usando en su P&S. Si usa el extremo ancho, puede salirse con la suya con velocidades de obturación más largas, pero puede obtener una distorsión de barril. Si está fotografiando documentos de texto y no una pantalla de computadora, le recomiendo probar con flash.

    Si puede, sujete el documento (pegado con cinta adhesiva o algo así para que quede plano) para que pueda apoyar la cámara en algo y obtener la velocidad de obturación que desee. También puede usar una bolsa de frijoles u objetos pequeños para inclinar la cámara mientras descansa. Además, puede obtener adaptadores de trípode para botellas de agua para un P&S.

  4. La apertura, la velocidad de obturación y el ISO forman un triángulo de exposición. Lea sobre esto aquí . Cuanto más alto sea el ISO, menor será la apertura y menor la velocidad de obturación que podrá utilizar, pero la imagen será más ruidosa. Recomiendo un ISO bajo (400 o menos) para un P&S con texto.

  5. Seleccione el balance de blancos para su situación de iluminación. Si tienes fluorescente, úsalo. Si utiliza flash, utilice el balance de blancos del flash.

No creo que f/8 sea realista para disparar cámara en mano en interiores (a menos que use flash, primero deberá pedir permiso a la biblioteca) además f/8 causará distracción con un sensor pequeño, la ganancia de nitidez es mínima en comparación con el aumento requerido en el tiempo de obturación/ISO.
@Matt f/8 es un ejemplo para mostrar que quiere un número más alto para aumentar la profundidad de campo (y reducir otras aberraciones como CA, que pueden ser visibles). No le di pautas porque no estoy seguro de cuánta luz tiene. ¿Distracción? ¿Te refieres a la difracción?
Sí, quise decir difracción: estoy escribiendo esto en mi teléfono, que tiene la molesta costumbre de corregir automáticamente mis palabras, incluso cuando las deletreo correctamente. CA no será un gran problema (en comparación con el movimiento de la cámara), creo que sería mejor detenerse de par en par, si la luz es un gran problema...
¿No te encanta la tecnología? Sí, diría que una parada desde la apertura total es una buena pauta y estoy de acuerdo en que el movimiento de la cámara sería el quid.
Esa es una muy buena sugerencia para disparar con el máximo de MP y luego reducir la resolución en la computadora. Puedo imaginar que la nitidez + contraste adicional conducirá a un texto mucho más nítido, más fácil de leer.

Estoy de acuerdo con las sugerencias para disparar en la resolución más alta disponible y reducir el tamaño en la computadora. Además, elija el jpeg de la más alta calidad que pueda obtener de su cámara, o incluso dispare sin procesar si su cámara lo permite, y conviértalo a tiff o png. La compresión con pérdida en jpeg puede crear artefactos alrededor del límite de tinta/papel que podrían confundir a su software de ocr.

En general, lo que desea hacer es usar configuraciones que obtengan la imagen más nítida que pueda obtener. Cosas como el contraste, el balance de blancos, etc. se pueden cambiar en la computadora. De hecho, aumentar el contraste usando la herramienta de niveles o la herramienta de contraste/brillo en Photoshop o GIMP podría ayudarte mucho.

Además, la conversión al formato de escala de grises reducirá sustancialmente el tamaño de sus archivos. Y si hace eso y aumenta el contraste, realmente no tiene que preocuparse por el balance de blancos. Puede experimentar con el balance de blancos, sin embargo, algunas configuraciones pueden producir un mejor contraste que otras (depende de su iluminación).

Si su computadora puede manejarlo, haga todos los ajustes (escala de grises, contraste, brillo) antes de reducir el tamaño y, después de reducir el tamaño, aplique un filtro de nitidez a la imagen.

Algunas ideas, que no he notado en ningún otro lugar, para agregar a la mezcla:

  • Si dispara "acercado" (más teleobjetivo ), hará que dispare más lejos de la página, lo que le dará una imagen más consistente con respecto al tamaño del texto (las palabras en una esquina estarán más cerca del mismo tamaño que las palabras en el medio; con gran angular, es posible que se distorsione con respecto a esto). No estoy seguro de cuál es la configuración "ideal" aquí, y es una compensación frente a las velocidades de obturación requeridas, potencialmente, solo algo en lo que pensar.

  • Querrá " sobreexponer " en comparación con lo que su cámara probablemente piense que es correcto de manera predeterminada (a menos que sea lo suficientemente inteligente como para adivinar que esto es papel; lo pongo entre comillas porque realmente no desea sobreexponerlo) , solo sobreexponer basado en la medición de una página en blanco), porque el tono principal (el papel en sí) será lo principal que la cámara intente exponer, y si expone el papel como gris medio, tendrá un punto de partida más turbio. Si "sobreexpone" de punto y medio a 2 puntos (simplemente no vaya al punto de recortar los reflejos), el texto aún debe ser agradable y oscuro, pero el papel será agradable y brillante, haciendo separaciones de contraste ( y por lo tanto OCR) más fácil.

  • intente tener una iluminación uniforme : si una esquina de la página es mucho más clara o más oscura que otra, será más difícil separar las cosas en el negro puro y el blanco puro que probablemente desee para propósitos de OCR.

  • un "soporte de copia" es ideal para proyectos como este, aunque supongo que más allá de lo que podría tener fácilmente en la biblioteca... Sin embargo, dependiendo de la forma en que esté configurada su biblioteca, es posible que haya algún lugar (tal vez un estante sobre el escritorio, o una barra que sostiene la iluminación o similar?) que podría colocar una súper abrazadera con una cabeza de bola ( aquí hay una , pero cualquier súper abrazadera con un "perno" del tamaño apropiado (dependiendo de la cabeza) y algún tipo de trípode la cabeza lo haría), y su cámara luego se monta sobre la superficie del escritorio (o lo que sea), para que pueda tener un posicionamiento consistente y estabilidad en caso de que necesite exposiciones más largas. Básicamente, esto equivaldría a un soporte de copia de "pobre hombre".

    También es posible que desee usar un disparador automático corto o un control remoto (supongo que su cámara tiene un modo de disparador automático de 2 segundos, y tal vez uno personalizado que podría ser aún más corto), para evitar que la cámara se mueva al presionar el botón.

Eso es todo lo que estoy pensando por el momento. Espero que eso sea útil.

Tengo el mismo trabajo que tu foto Landman y lo he hecho durante años y años. La mayoría de la gente no sabe de lo que está hablando, ¡créame!

  1. La cámara en M o manual

  2. Iso 100-200 cuanto mayor sea el #, más brillante, pero obtiene más grano o ruido en la imagen

  3. Velocidad de obturación 1/100 a 1/160 (generalmente 1/125 es mejor, cuanto más bajo, más brillante, pero obtienes más entierros o retomas)

  4. Apertura o f2.7 (¿por qué necesitarías un campo de visión profundo? Es una página plana)

  5. Dispare en color, de 6 a 10 megapíxeles, mire a través de la configuración de balance de blancos, generalmente fluorescente 1 o 2, apague la mayoría de las campanas y silbidos si no está seguro, apáguelos

  6. exponer fotos en borrador usando acdc

Algunas pequeñas sugerencias, pero creo que su configuración se ve bien

  1. Usa un trípode. Esto eliminará cualquier problema con el movimiento de la cámara y le permitirá usar la exposición más larga que necesite.

  2. Evite que la luz caiga directamente sobre el papel en un ángulo que pueda reflejarse directamente en la lente y causar reflejos donde no los desea. Esto generalmente significa asegurarse de que la luz provenga de los lados.

  3. ISO: Como regla general, debe errar hacia un valor más bajo, pero estoy seguro de que cualquier diferencia material se hará evidente rápidamente.

Aparte de eso, no puedo pensar en ninguna forma de mejorar su configuración. Para ser honesto, creo que lo tienes.

¿Puede sugerirme un trípode bueno (y relativamente económico) que sea útil y me permita voltear la cámara para que quede paralela a las páginas que estoy fotografiando? He mirado los trípodes Joby y parecen prometedores, pero he oído que a menudo se mueven cuando golpeas el obturador.
@Jason, punto justo. Tengo un Joby, que me gusta, pero para que deje de moverse cuando golpeas el obturador, solo usa un disparador remoto o usa el disparador automático. En realidad, este es un buen consejo para cualquier momento en que esté utilizando una velocidad de obturación lenta. La mala noticia es que cualquier trípode lo suficientemente pesado como para ser muy estable no será barato. ¡Lo lamento! (Si descubres algo diferente, ¡avísame!) ;)

Parece que ya tienes la mayoría de las respuestas :-P Solo agregaré algunos comentarios sobre tus puntos:

  1. Resolución: tiene razón, no necesitará mucha resolución aquí, especialmente si solo va a ver las imágenes en la pantalla. Probablemente lo limitaría al doble de la resolución máxima de pantalla típica.

  2. Apertura: tiene razón al seleccionar una apertura más pequeña para obtener un poco de margen de maniobra en la profundidad de campo. Sin embargo, es probable que no necesite mucho. Juegue con la calculadora de profundidad de campo para su distancia focal, calcule un DOF razonable y luego vaya con la mayor apertura que pueda. (Sin embargo, asegúrese de estar una o dos paradas por debajo de su apertura máxima para obtener la mejor nitidez). Desea la apertura más grande para tener más espacio para jugar con el obturador y la ISO; vea abajo.

  3. Obturador: obviamente, desea que esto sea lo más rápido posible para reducir el movimiento y, al mismo tiempo, obtener suficiente luz. Escuché que varias fuentes afirman "velocidad de obturación igual a la distancia focal" para evitar sacudidas; algunos reclaman el doble. Entonces, si está usando una lente de 50 mm, intente mantener la velocidad de obturación entre 1/50 y 1/100. Una vez que tenga eso, intente la velocidad más lenta para maximizar la luz.

  4. ISO: debería poder aumentar esto bastante alto. El ruido puede reducir el aspecto de la imagen, pero probablemente no degrade demasiado su legibilidad. Lo que es "ISO alto" y "demasiado ruidoso" depende de su cámara. Experimento. Esta es probablemente la mejor manera de obtener la exposición correcta con poca luz, en comparación con la apertura y el obturador.

  5. Balance de blancos: para ti, no debería importar demasiado. Si el papel fotografiado se ve blanquecino, ¿importa? (Diferente historia si estás fotografiando libros con imágenes a todo color, por supuesto). Si desea corregirlo en la publicación, lo tendrá relativamente fácil, ya que tiene mucho papel de color neutro para trabajar. Probablemente dejaría su cámara en Balance de blancos automático y me olvidaría de eso.