Hay algunas preguntas de ocr en este sitio, pero son solo para Linux o solo para archivos PDF.
Así que estoy buscando una herramienta que convierta imágenes con texto en texto editable (.doc/.txt).
necesita:
Las mejores herramientas de OCR disponibles para uso personal en términos de precisión son Nuance OmniPage , ABBYY FineReader y Acrobat XI Pro . (No he mirado los puntos de referencia , pero tuve esta impresión cuando estaba buscando uno hace unos años). Pero todos cuestan más de 20 USD.
Tesseract se considera la mayor parte del tiempo como el motor OCR de código abierto más preciso. Existen varias GUI de Tesseract . De lo contrario, puede usar algunos enlaces, como en el ejemplo a continuación.
Ejemplo :
Convierta la imagen a tif con ImageMagick:
#convert myimage.jpeg -auto-level -compress none myimage.tif
Código de Python para leer datos de myimage.tif (Tesseract necesita TIFF como entrada):
from PIL import Image from pytesser.pytesser import * image_file = 'myimage.tif' im = Image.open(image_file) text = image_to_string(im) text = image_file_to_string(image_file) text = image_file_to_string(image_file, graceful_errors=True) print "=====output=======\n" print text
FYI: comparación de software de reconocimiento óptico de caracteres
Cornelio
ᔕᖺᘎᕊ
Cornelio
Barath Vutukuri