Hay muchos programas para extraer las imágenes, pero lo que quiero es un PDF sin imágenes.
No es demasiado difícil de operar, no hay intervención manual, como encontrar imágenes repetidamente y eliminarlas y luego guardarlas en un nuevo documento.
Solo un programa al que puedo dar el nombre de un archivo (o directorio) y terminar con archivos PDF sin imágenes.
No importa la línea de comando o la GUI.
Si no desea que se conserve el formato, puede hacerlo fácilmente.
Utilice el lector de Foxit. Haga un guardado como archivo de texto.
Ahora use una impresora pdf gratuita como foxit printer o cutepdf para imprimir en archivos pdf.
Hice una búsqueda en Google y descubrí que un extractor A-PDF gratuito ( http://www.a-pdf.com/text/download.htm ) tiene esta capacidad.
Vea la imagen a continuación. He mostrado el pdf y el archivo de texto extraído uno al lado del otro. Espero que esto sea lo que estabas buscando. :)
Programáticamente, puede usar la biblioteca Apache PDFBox :
Puede usar la opción de borrador de cpdf :
cpdf -draft in.pdf -o out.pdf
Respuesta robada de: https://stackoverflow.com/a/20702568/40961
Considere este enlace, le ayudará
http://www.pdfaid.com/ExtractImages.aspx
Características
Además, esta herramienta le permite guardar sus imágenes en formato como jpg, gif, png o bmp.
Una vez que haya terminado con la selección de formato, también puede dar el número a la imagen para que pueda relacionar las imágenes con el documento (es solo su deseo)
Puede lograr todo esto con un solo clic solo como lo que está buscando.
También puede probar esta herramienta en línea para realizar su tarea. La mejor parte es que no se requiere instalación para esta herramienta. Es completamente gratis.
Mihai Iancu
Mawg dice que reincorpore a Monica