Dividir pdf en varias imágenes, comprimir y recombinar

Quiero guardar cada página de un archivo PDF como una imagen separada, comprimirlas y volver a combinarlas como PDF.

Algunos archivos PDF que utilizo con frecuencia tienen un tamaño extrañamente grande. Es decir, unas 100 páginas pero unos 200M. Sospecho que esto se debe a que algunos archivos PDF se guardan de manera gráfica con una resolución demasiado alta o de una manera que no se comprime correctamente. El hecho de que los archivos que tienen condiciones similares, en términos de resolución y legibilidad, a menudo tengan un tamaño más pequeño, me hace preguntarme si todavía hay espacio para la compresión. (No tengo conocimiento en procesamiento de imágenes, así que esto es solo mi sensación).

Mi plan es el siguiente. Pregunto de 1 y 3, y es deseable que pueda hacer todo esto en la línea de comando, para que yo mismo pueda escribir un script de ajuste, lo cual será fácil. La captura de pantalla hace 1 y la vista previa puede hacer 3, pero no está claro si se pueden hacer con CLI.

  1. Guarde cada página del PDF como imagen.

  2. Filtra cada imagen. No pido esta parte, ya que las herramientas de procesamiento de imágenes abundan. Puedo explorar filtros apropiados yo mismo. En términos de legibilidad, encuentro que reduce el tamaño del archivo si la imagen se pone en blanco y negro.

  3. Recombina estas imágenes

Si tiene formas totalmente diferentes de comprimir un PDF, también es bienvenido. Tal vez haya alguien que haya envuelto todo el proceso, y no necesito reinventar la rueda.

Respuestas (1)

Convertir un PDF que es principalmente texto en imágenes seguramente aumentará el tamaño del archivo, no lo disminuirá. Los archivos PDF son bastante eficientes para contener texto: la conversión a imagen lo niega, ya que solo está almacenando imágenes.

La vista previa incluye una opción para reducir el tamaño del archivo para archivos PDF. Abra el PDF con Vista previa, elija Archivo → Exportar y seleccione Filtro de cuarzo: Reducir tamaño de archivo. También puede elegir Blanco y negro aquí, lo que también puede reducir el tamaño del archivo.

Si realmente desea ver una conversión de su PDF a un PDF de imágenes, puede usar ImageMagick .

convert /path/to/in.pdf -resize 100% -compress Group4 /path/to/out.pdf