¿Programa que lee una fotografía torcida y extrae las palabras de la imagen? [duplicar]

Lo que estoy tratando de hacer es esencialmente:

  1. Me dan una foto de un libro/papel. Se escribieron todas las palabras de esta imagen, pero no puedo extraerlas con el cursor.

  2. De esta imagen, quiero extraer todas las palabras. ¿Hay algún programa que pueda tomar la imagen y extraer todas las palabras (con espacios, mayúsculas, puntuación, etc...)?

Creo que mi pregunta puede ser diferente del enlace en el comentario a continuación porque la imagen de la que estoy tratando de extraer palabras es una imagen de teléfono de una página en un libro. El ángulo está ligeramente sesgado. He probado el lector OCR de Adobe y no me da una salida correcta.

Principalmente uso macOS. Sin embargo, puedo obtener acceso a Windows 7 (y 10) y Linux. La calidad es primaria y el costo es secundario a una "extensión". Realmente estoy buscando un buen software y estoy dispuesto a gastar algo de dinero.

Necesito manejar 100 páginas en total.

¿Tienes mucho? Para "solo unos pocos", puede encontrar que un servicio en línea es más fácil que hacerlo todo usted mismo: he usado con éxito onlineocr.net para convertir capturas de pantalla del código de programación (java) en texto sin formato que luego podría usar ...
Tengo bastantes en este momento, y estoy seguro de que tendré más en los próximos meses. Probablemente alrededor de 100 páginas en total en los próximos meses. Probé la herramienta Adobe OCR, y no hace un buen trabajo en absoluto. Lo probé en una imagen anterior y me dio muchos símbolos de aspecto extraño.

Respuestas (2)

Uno de los programas clave de OCR es Tesseract OCR , que es una herramienta de línea de comandos, de código abierto, con licencia Apache y multiplataforma. Es gratuito y puede admitir una gran cantidad de idiomas (> 100, incluida la compatibilidad con Unicode) y se puede entrenar para más. Se ha desarrollado desde 1985 y todavía, (2017), se está desarrollando activamente. Está disponible desde la fuente o como binarios preconstruidos para Windows, Linux, Mac, Android.

Al igual que con la mayoría del software de OCR, la precisión dependerá de la calidad de la imagen (que es posible que pueda aclarar) y posiblemente del entrenamiento del paquete para la fuente, etc., así como el idioma. Por ejemplo, si el ángulo del texto está torcido, vale la pena usar un editor de imágenes como GIMP para enderezar el ángulo de la imagen.

Hay una serie de GUI enumeradas aquí bajo varias licencias y para varias plataformas.

Servicios web

También hay una gran cantidad de servicios web disponibles que usan la misma tecnología, pero una palabra de precaución: no use los servicios web para obtener información privada o confidencial, ya que el uso de algunos de estos servicios cuenta cuando publica la información al mundo y/o algunos servicios se reservan el derecho de usar su información de cualquier forma que elijan .

¿"cuenta como publicación de la información" significado? ¿Gramático?
@Pacerier: creo que he mejorado la precaución tanto en términos de claridad como de gramática.

Si pega una imagen en MS OneNote y hace clic derecho en la imagen, hay una opción para "Copiar texto de la imagen". A continuación, puede pegarlo donde lo necesite. Este método está lejos de ser perfecto. Depende de la calidad del texto en la imagen y la fuente utilizada. Pero he extraído largas líneas de texto de las imágenes. Puede ser más rápido que copiar/escribir mientras se lee texto de un solo tipo.

Nota: Estoy usando la versión de Windows.

Esto parece no funcionar en la versión Mac de OneNote. Probaré una versión de Windows cuando tenga acceso.
OK, lo agregué en la respuesta en caso de que alguien más vea esto. La mejor de las suertes.