Herramienta OCR para imágenes en Windows [duplicado]

Question

Herramienta OCR para imágenes en Windows [duplicado]

LOC
ventanas
Software
procesamiento de imágenes

ᔕᖺᘎᕊ

Hay algunas preguntas de ocr en este sitio, pero son solo para Linux o solo para archivos PDF.

Así que estoy buscando una herramienta que convierta imágenes con texto en texto editable (.doc/.txt).

necesita:

ser gratis o relativamente barato (< £ 20)
ser lo más preciso posible
ignorar imágenes
ejecutar en Windows 7 de 64 bits
definitivamente admite archivos .jpeg y .gif

Cornelio

Tesseract puede hacer exactamente lo que quieras: softwarerecs.stackexchange.com/a/10029/2401

ᔕᖺᘎᕊ

@Cornelius ¡Me lo perdí por completo! +1. ¡Por favor vota para cerrar esto como un tonto!

Cornelio

Esa respuesta habla sobre la salida en pdf, pero también puede generar texto sin formato.

Barath Vutukuri

Uso Microsoft OneNote como herramienta de OCR. Al hacer clic con el botón derecho en una imagen, puede copiar el texto completo en imágenes y también tiene la capacidad de buscar texto en la imagen. Es gratuito y preciso, se ejecuta en Windows y es compatible con casi todos los formatos de imagen. El punto extra es que admite varios idiomas :) Inglés, francés, español también

Respuestas (1)

Herramienta OCR para imágenes en Windows [duplicado]

Tesseract puede hacer exactamente lo que quieras: softwarerecs.stackexchange.com/a/10029/2401
@Cornelius ¡Me lo perdí por completo! +1. ¡Por favor vota para cerrar esto como un tonto!
Esa respuesta habla sobre la salida en pdf, pero también puede generar texto sin formato.
Uso Microsoft OneNote como herramienta de OCR. Al hacer clic con el botón derecho en una imagen, puede copiar el texto completo en imágenes y también tiene la capacidad de buscar texto en la imagen. Es gratuito y preciso, se ejecuta en Windows y es compatible con casi todos los formatos de imagen. El punto extra es que admite varios idiomas :) Inglés, francés, español también

franck dernoncourt · Answer 1

Las mejores herramientas de OCR disponibles para uso personal en términos de precisión son Nuance OmniPage , ABBYY FineReader y Acrobat XI Pro . (No he mirado los puntos de referencia , pero tuve esta impresión cuando estaba buscando uno hace unos años). Pero todos cuestan más de 20 USD.

Tesseract se considera la mayor parte del tiempo como el motor OCR de código abierto más preciso. Existen varias GUI de Tesseract . De lo contrario, puede usar algunos enlaces, como en el ejemplo a continuación.

Ejemplo :

Convierta la imagen a tif con ImageMagick:

#convert myimage.jpeg -auto-level -compress none myimage.tif

Código de Python para leer datos de myimage.tif (Tesseract necesita TIFF como entrada):

from PIL import Image
from pytesser.pytesser import *

image_file = 'myimage.tif'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text

FYI: comparación de software de reconocimiento óptico de caracteres

Nunca supe que Adobe XI Pro también era un programa OCR, cuesta £ 18, por lo que es < £ 20 ...
Creo que ese es el costo mensual, de lo contrario cuesta un poco más: amazon.com/Acrobat-Professional-XI-Windows-Download/dp/…
Esta es una pregunta duplicada. Por favor vote para cerrar como un tonto.
Uso Microsoft OneNote como herramienta de OCR. Al hacer clic con el botón derecho en una imagen, puede copiar el texto completo en imágenes y también tiene la capacidad de buscar texto en la imagen. Es gratuito y preciso, se ejecuta en Windows y es compatible con casi todos los formatos de imagen. El punto extra es que admite varios idiomas :) Inglés, francés, español también

Herramienta OCR para imágenes en Windows [duplicado]

ᔕᖺᘎᕊ

Cornelio

ᔕᖺᘎᕊ

Cornelio

Barath Vutukuri

Respuestas (1)

franck dernoncourt

ᔕᖺᘎᕊ

franck dernoncourt

ᔕᖺᘎᕊ

franck dernoncourt

ᔕᖺᘎᕊ

Barath Vutukuri

Programa gratuito de Windows para archivos de marcas de agua por lotes

Escaneo de respuestas de opción múltiple del papel

Quitar marcas de bolígrafo de una copia escaneada de un libro

Software de Windows para recortar automáticamente los bordes de fotografías de documentos

Herramienta de indexación, procesamiento y gestión en general de documentos digitalizados

Biblioteca para marco/biblioteca de procesamiento de imágenes pre OCR

¿Programa que lee una fotografía torcida y extrae las palabras de la imagen? [duplicar]

Software para recortar imágenes por lotes

Agregue canal alfa y elimine el fondo para más de 2 imágenes a la vez en Windows

Editor de imágenes moderno y económico para unir imágenes, dibujar formas básicas, recortar, cambiar el tamaño