Hay una acción en Automator que le permite " Extraer texto PDF " mediante programación, pero falla cuando se alimenta una cantidad moderada de archivos (25 a 100). Peor aún, falla sin registrar nada útil, excepto un mensaje que dice "Automator Quit Unexpectedly".
¿Alguien sabe de un comando equivalente para hacer esto en Applescript? Estoy buscando herramientas en las que tenga más control sobre cosas como el registro y el manejo de errores para poder ser más eficiente en el procesamiento de archivos PDF en formato de texto.
No sé cómo se compara con otras opciones, pero podría usar pdfotext. Se puede instalar con brew install xpdf
.
do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings
Calibre también viene con algunas utilidades de línea de comandos:
/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt
Preguntas relacionadas:
bmike
usuario141146
Simón