Herramienta OCR para imágenes en Windows [duplicado]

Hay algunas preguntas de ocr en este sitio, pero son solo para Linux o solo para archivos PDF.

Así que estoy buscando una herramienta que convierta imágenes con texto en texto editable (.doc/.txt).

necesita:

  • ser gratis o relativamente barato (< £ 20)
  • ser lo más preciso posible
  • ignorar imágenes
  • ejecutar en Windows 7 de 64 bits
  • definitivamente admite archivos .jpeg y .gif
Tesseract puede hacer exactamente lo que quieras: softwarerecs.stackexchange.com/a/10029/2401
@Cornelius ¡Me lo perdí por completo! +1. ¡Por favor vota para cerrar esto como un tonto!
Esa respuesta habla sobre la salida en pdf, pero también puede generar texto sin formato.
Uso Microsoft OneNote como herramienta de OCR. Al hacer clic con el botón derecho en una imagen, puede copiar el texto completo en imágenes y también tiene la capacidad de buscar texto en la imagen. Es gratuito y preciso, se ejecuta en Windows y es compatible con casi todos los formatos de imagen. El punto extra es que admite varios idiomas :) Inglés, francés, español también

Respuestas (1)

Las mejores herramientas de OCR disponibles para uso personal en términos de precisión son Nuance OmniPage , ABBYY FineReader y Acrobat XI Pro . (No he mirado los puntos de referencia , pero tuve esta impresión cuando estaba buscando uno hace unos años). Pero todos cuestan más de 20 USD.

Tesseract se considera la mayor parte del tiempo como el motor OCR de código abierto más preciso. Existen varias GUI de Tesseract . De lo contrario, puede usar algunos enlaces, como en el ejemplo a continuación.

Ejemplo :

Convierta la imagen a tif con ImageMagick:

#convert myimage.jpeg -auto-level -compress none myimage.tif

Código de Python para leer datos de myimage.tif (Tesseract necesita TIFF como entrada):

from PIL import Image
from pytesser.pytesser import *

image_file = 'myimage.tif'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text

FYI: comparación de software de reconocimiento óptico de caracteres

Nunca supe que Adobe XI Pro también era un programa OCR, cuesta £ 18, por lo que es < £ 20 ...
Creo que ese es el costo mensual, de lo contrario cuesta un poco más: amazon.com/Acrobat-Professional-XI-Windows-Download/dp/…
Esta es una pregunta duplicada. Por favor vote para cerrar como un tonto.
Claro, lo siento, no vi la otra pregunta.
Yo tampoco :)
Uso Microsoft OneNote como herramienta de OCR. Al hacer clic con el botón derecho en una imagen, puede copiar el texto completo en imágenes y también tiene la capacidad de buscar texto en la imagen. Es gratuito y preciso, se ejecuta en Windows y es compatible con casi todos los formatos de imagen. El punto extra es que admite varios idiomas :) Inglés, francés, español también