Estoy haciendo un escaneo de una colección de notas con muchas imágenes de inventos y matemáticas y organizándola en una wiki. Las páginas del cuaderno consisten en bloques de texto, imágenes y subtítulos al estilo de los cuadernos de Lenardo Da Vinci. . El texto tendrá que ser transcrito y las imágenes elegidas para las mejores, ya que hay mucha duplicación.
Estoy buscando una solución de software para seleccionar rápidamente varias regiones de una página a la vez, recortarlas y guardarlas en archivos separados. También sería deseable poder etiquetarlos con metadatos para que puedan clasificarse más fácilmente más tarde, o poder guardarlos con una buena convención de nomenclatura automática que aclare su origen. Es necesario poder seleccionar y guardar las imágenes como proceso por lotes, ya que hay decenas de miles de páginas que recorrer. Cada página probablemente se recortará no menos de 5 veces. Recortar, guardar como, deshacer y luego recortar nuevamente haría esto muy tedioso, aunque sabía que esto se puede hacer con todo el software fotográfico.
Me parecen algunas soluciones similares, pero han sido para separar varias fotos que se han escaneado juntas en lugar de recortar varias imágenes que tienen dibujos y texto yuxtapuestos en la misma página. También he explorado el software de reconocimiento óptico de caracteres que selecciona demasiadas regiones para que pueda ahorrar en cualquier momento. Creo que las regiones tendrán que seleccionarse manualmente.
Otra ventaja sería poder pasar a la siguiente imagen después de recortar la imagen actual. He visto programas de recorte por lotes como este, pero no le permiten seleccionar múltiples regiones.
Se necesitaría un esfuerzo manual para eliminar las fotos innecesarias, pero podría usar la herramienta de región en Photoshop para dividir la imagen más grande en varias imágenes de región más pequeñas. Normalmente se usa para hacer diseños web, pero debería funcionar para sus propósitos si no se encuentra una mejor opción.
Suena como dos opciones para convertir automáticamente las notas escaneadas en documentos con imágenes y texto:
Google Docs (convertir a documento al cargar):
http://support.google.com/drive/bin/answer.py?hl=es&answer=176692
Adobe PDF Creator:
http://www.adobe.com/products/acrobat/convert-jpeg-scan-ocr-to-pdf.html
ab.aditya
mattdm
Michael C
mattdm
dpollitt