Estoy buscando un software gratuito que convierta un PDF en un archivo LaTeX.
En realidad, no lo necesito para convertir todo el PDF, solo necesito "extraer" las fórmulas y usarlas para crear mi propio archivo LaTeX.
Puedes usar InftyReader :
Otras ideas
Puede usar im2markup para convertir imágenes de ecuaciones matemáticas a ecuaciones matemáticas LaTeX:
Sobre la base de los avances recientes en la generación de leyendas de imágenes y el reconocimiento óptico de caracteres (OCR), presentamos un sistema basado en aprendizaje profundo de propósito general para descompilar una imagen en un marcado de presentación. Si bien esta tarea es un problema bien estudiado en OCR, nuestro método adopta un enfoque intrínsecamente diferente basado en datos. Nuestro modelo no requiere ningún conocimiento del lenguaje de marcado subyacente y simplemente se entrena de principio a fin con datos de ejemplo del mundo real. El modelo emplea una red convolucional para el reconocimiento de texto y diseño junto con un sistema de traducción automática neuronal basado en la atención. Para entrenar y evaluar el modelo, presentamos un nuevo conjunto de datos de expresiones matemáticas renderizadas del mundo real combinadas con marcado LaTeX, así como un conjunto de datos sintéticos de páginas web combinadas con fragmentos de código HTML. Los resultados experimentales muestran que el sistema es sorprendentemente efectivo para generar marcas precisas para ambos conjuntos de datos. Mientras que un sistema LaTeX OCR estándar de dominio específico logra una precisión de alrededor del 25 %, nuestro modelo reproduce la imagen renderizada exacta en el 75 % de los ejemplos.
Martín Schröder