Elimina todas las imágenes de un PDF

Hay muchos programas para extraer las imágenes, pero lo que quiero es un PDF sin imágenes.

No es demasiado difícil de operar, no hay intervención manual, como encontrar imágenes repetidamente y eliminarlas y luego guardarlas en un nuevo documento.

Solo un programa al que puedo dar el nombre de un archivo (o directorio) y terminar con archivos PDF sin imágenes.

No importa la línea de comando o la GUI.

¿Una biblioteca .net y una aplicación de muestra que muestra cómo implementar su solicitud califican como una solución?
+1 por preguntar. Respuesta corta, no lo sé hasta que lo veo. Uso Delphi de Embarcadero y esperaba un componente VCL. Sin embargo, Delphi es compatible con .NETT (simplemente no lo probé todavía). Si lo publicas como respuesta a mi pregunta de seguimiento "ok, lo codificaré yo mismo", seguro que recibirás una votación positiva. Dejaré esta pregunta abierta en caso de que alguien pueda señalar una aplicación existente. Para la codificación, consulte softwarerecs.stackexchange.com/questions/18842/… Gracias

Respuestas (4)

Si no desea que se conserve el formato, puede hacerlo fácilmente.

Utilice el lector de Foxit. Haga un guardado como archivo de texto.

Ahora use una impresora pdf gratuita como foxit printer o cutepdf para imprimir en archivos pdf.

Editar: para preservar el formato de párrafo

Hice una búsqueda en Google y descubrí que un extractor A-PDF gratuito ( http://www.a-pdf.com/text/download.htm ) tiene esta capacidad.

Vea la imagen a continuación. He mostrado el pdf y el archivo de texto extraído uno al lado del otro. Espero que esto sea lo que estabas buscando. :)

Visor de PDF XChange y Notepad++ Windows

Weeeeell, .... funciona. PERO, el formato deja mucho que desear. Los párrafos se dividen en varias líneas, con líneas en blanco entre ellas. ¿Conoces alguna forma de formatear eso correctamente?
He editado la respuesta con lo que creo que es la solución en beneficio de otra persona que puede tener este problema.
¡Fantástico! Bien, aquí hay algunas líneas en blanco menos de las que me gustarían, pero sin duda es lo suficientemente bueno como para leer Bienvenido a bordo. Una gran primera respuesta.

Programáticamente, puede usar la biblioteca Apache PDFBox :

Apache PDFBox

Puede usar la opción de borrador de cpdf :

cpdf -draft in.pdf -o out.pdf

Respuesta robada de: https://stackoverflow.com/a/20702568/40961

Y pensé que había buscado bien antes de preguntar ;-) Gracias

Considere este enlace, le ayudará

http://www.pdfaid.com/ExtractImages.aspx

Características

  • Además, esta herramienta le permite guardar sus imágenes en formato como jpg, gif, png o bmp.

  • Una vez que haya terminado con la selección de formato, también puede dar el número a la imagen para que pueda relacionar las imágenes con el documento (es solo su deseo)

Puede lograr todo esto con un solo clic solo como lo que está buscando.

También puede probar esta herramienta en línea para realizar su tarea. La mejor parte es que no se requiere instalación para esta herramienta. Es completamente gratis.

http://www.extractopdf.com/

Esto no hace lo que pedí. Por favor, lea la pregunta de nuevo. Sí, saca imágenes de PDF, en el sentido de que te permite extraerlas y almacenarlas en algún lugar. PERO, el PDF original sigue sin cambios. Quiero sacar imágenes de un PDF en el sentido de ELIMINARLAS. dejando atrás un PDF sin imágenes.