Quiero fusionar varios cientos de archivos pdf en un directorio automáticamente de acuerdo con sus nombres de archivo.
P.ej
Los archivos 1000.1.pdf 1000.2.pdf 1000.3.pdf 1000.x.pdf deben fusionarse en 1000.pdf
y
2000.abc.pdf 2000.def.pdf 2000.ghi.pdf 2000.jkl.pdf 2000.5.pdf en 2000.pdf .
No quiero usar soluciones basadas en Preview/Automator (si está disponible) porque, en comparación con software de terceros como Adobe Acrobat o PDFpen, la combinación de archivos PDF a menudo (dependiendo de los documentos de origen) da como resultado un aumento significativo en el tamaño del archivo (consulte, por ejemplo, ¿Qué causa que el tamaño del archivo PDF aumente cuando se guarda en Vista previa? )
Tiene alguna recomendación? ¡Gracias!
Prueba pdftk . Es un software de línea de comandos que puede unir archivos PDF (y hacer muchas otras cosas también, pero eso no es relevante aquí). Puede descargarlo desde la página web oficial de pdftk .
Ejemplo de sintaxis:
pdftk old1.pdf old2.pdf old3.pdf cat output new.pdf
creará el archivo new.pdf
que contiene la concatenación de los archivos old1.pdf
, old2.pdf
, old3.pdf
.
Para resolver su problema, con sus nombres de archivo de ejemplo:
pdftk 1000.*.pdf cat 1000.pdf
pdftk 2000.*.pdf cat 2000.pdf
etcétera. Puede usar secuencias de comandos de shell para que esto sea completamente automático si lo desea (pero tendrá que pasar un poco de tiempo aprendiendo cómo escribir secuencias de comandos de shell).
Suponiendo que todos los archivos se llamen 1000.x, 2000.x, etc., un script de shell podría verse así
#!/bin/bash
for n in {1..9}; do
if [[ -r ${n}000.1.pdf ]]; then
rm -f ${n}000.pdf
pdftk ${n}000.*.pdf cat ${n}000.pdf && mv ${n}000.*.pdf ~/.Trash/
fi
done
pdftk
ya no se basa en 10.10 "El Capitán". Consulte trac.macports.org/ticket/48528Hay un script de Python oculto en Automator.app que une archivos .PDF
/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --help
Usage: join [--output <file>] [--shuffle] [--verbose]
Ejemplo de uso:
/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output all.pdf *.pdf
~/.bash_profile
archivo de esta manera: alias catpdf="/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output all.pdf *.pdf"
así que puedo cd
ingresar a un directorio que contiene archivos PDF y ejecutar catpdf
.Puede usar pdfunite
distribuido con poppler
. Puedes instalar poppler
con Homebrew:
brew install poppler
Y ahora úsalo:
pdfunite input1.pdf input2.pdf input3.pdf output.pdf
poppler
también viene con estos otros comandos: pdfdetach
, pdffonts
, pdfimages
, pdfinfo
, pdfseparate
, pdftocairo
, pdftohtml
, pdftoppm
, pdftops
, pdftotext
, además de pdfunite
.
¡pdftk ya no funciona en El Capitán! (OSX 10.10)
Una alternativa es pagemaster de PDFTron. La sintaxis sería:
pagemaster -m *.pdf -o output.pdf
No tiene el problema de aumento de tamaño de archivo de la solución de Automator anterior, ya que utiliza una biblioteca de PDF personalizada.
Nota: esta no es una herramienta gratuita. La versión de demostración agrega una fina marca de agua en cada página.
sin ladera
lejonet
sin ladera
Ruscos
sin ladera
Ruscos
lejonet
lejonet
sin ladera