Conversor de PDF a LaTeX

Estoy buscando un software gratuito que convierta un PDF en un archivo LaTeX.

En realidad, no lo necesito para convertir todo el PDF, solo necesito "extraer" las fórmulas y usarlas para crear mi propio archivo LaTeX.

Respuestas (2)

Puedes usar InftyReader :

  • libre
  • generar LaTeX a partir de imágenes de fórmulas matemáticas (los archivos de imágenes de origen deben estar en formato TIF, PNG o GIF)
  • lejos de ser perfecto en términos de precisión, pero no conozco nada mejor.

Otras ideas

Esperaba que hubiera algo más completo. Afortunadamente, 5 páginas al día sigue siendo un buen límite para mí :-), gracias

Puede usar im2markup para convertir imágenes de ecuaciones matemáticas a ecuaciones matemáticas LaTeX:

  • Deng, Yuntian, Anssi Kanervisto y Alexander M. Rush. "Lo que obtienes es lo que ves: un descompilador de marcado visual". preimpresión de arXiv arXiv:1609.04938 (2016). https://arxiv.org/abs/1609.04938
  • código abierto: basado en ANN, Torch7

Sobre la base de los avances recientes en la generación de leyendas de imágenes y el reconocimiento óptico de caracteres (OCR), presentamos un sistema basado en aprendizaje profundo de propósito general para descompilar una imagen en un marcado de presentación. Si bien esta tarea es un problema bien estudiado en OCR, nuestro método adopta un enfoque intrínsecamente diferente basado en datos. Nuestro modelo no requiere ningún conocimiento del lenguaje de marcado subyacente y simplemente se entrena de principio a fin con datos de ejemplo del mundo real. El modelo emplea una red convolucional para el reconocimiento de texto y diseño junto con un sistema de traducción automática neuronal basado en la atención. Para entrenar y evaluar el modelo, presentamos un nuevo conjunto de datos de expresiones matemáticas renderizadas del mundo real combinadas con marcado LaTeX, así como un conjunto de datos sintéticos de páginas web combinadas con fragmentos de código HTML. Los resultados experimentales muestran que el sistema es sorprendentemente efectivo para generar marcas precisas para ambos conjuntos de datos. Mientras que un sistema LaTeX OCR estándar de dominio específico logra una precisión de alrededor del 25 %, nuestro modelo reproduce la imagen renderizada exacta en el 75 % de los ejemplos.

ingrese la descripción de la imagen aquí