Impresora bonita de HTML a PDF (procesador)

Para fines de documentación, necesito una aplicación o un complemento que apunte a la creación de PDF a partir de páginas web y vaya más allá de las funciones rudimentarias proporcionadas por los navegadores comunes.

debe tener

  • selección de varias subpáginas
  • consistencia documento-enlace interno
  • encabezado/pie de página personalizable
  • escala de documentos y bordes de página ajustables
  • supresión de partes del sitio seleccionadas (encabezado, navegación, paneles laterales) especialmente para páginas que no proporcionan hojas de estilo de impresora

bueno para tener

  • inserciones de salto de página personalizadas
  • tabla de generación de contenido
  • sustitución de fuente
  • control de flujo de texto
  • rediseño de varias columnas
  • generación de propiedades del documento (metadatos)
Parece que está tratando de automatizar (?) el diseño basado en pantalla en un diseño de estilo de documento, siempre algo no trivial. ¿Ha considerado ir al otro lado PDF -> HTML o simplemente generar archivos PDF a partir de la misma información pero sin tratar de convertir páginas HTML arbitrariamente complejas?
En los casos en los que tenga control sobre el contenido presentado, de hecho es más apropiado seguir el principio de fuente única. Si es un consumidor externo de un artefacto determinado, el esfuerzo depende de su caso de uso.

Respuestas (2)

Para crear salidas en PDF de páginas web, veo una solución valiosa utilizando el navegador Mozilla Firefox , junto con los complementos ScrapBook e Print pages to PDF :

ingrese la descripción de la imagen aquí

El Scrapbookcomplemento realiza la captura de páginas en la barra lateral del navegador (eligiendo un comando en el menú del botón derecho de la ventana del navegador, o usando las opciones de Guardar en el menú del Libro de recuerdos). También existe la posibilidad de configurar teclas de acceso directo personalizadas para muchos comandos.

Una vez que una página se guarda y se muestra en la barra lateral, si está buscando resultados rápidos, simplemente haga clic con el botón derecho en el nombre de la página y elija imprimirla:

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Podemos ver fácilmente que tenemos un bonito table of contenty todo el internal (and external) linkstrabajo sin problemas!

Mirando en las propiedades del documento no veo nada especial, solo el Título y el Productor. (No encontré una forma de agregar metadatos personalizados dentro del pdf).

ingrese la descripción de la imagen aquí

Vamos a producir otro pdf, pero esta vez caminaremos por el camino largo:

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Como puede ver, existe la posibilidad de elegir la profundidad del enlace. Usando el primer nivel en profundidad, tendrá la posibilidad de descargar 121 portadas de StackExchange:

ingrese la descripción de la imagen aquí

Tienes la opción incluso de hacer un pdf con las 121 páginas web o con una selección de marcadores de la barra lateral, por lo selection of multiple sub-pagesque también se cumple.

Mirando las Print pages to PDFpropiedades del complemento, se pueden ver varias opciones para formatear la salida (márgenes, tamaño de página), un esquema por títulos, encabezados y pies de página personalizados para todo el pdf o separados para páginas web individuales en el pdf.

Una de las características más útiles del Scrapbookcomplemento brinda la capacidad de cambiar el DOM eliminando los elementos secundarios, antes de guardar los cambios y convertirlos en PDF. Además, puede resaltar el texto o incluso colocar libremente anotaciones dentro de la página web:

ingrese la descripción de la imagen aquí

Eso parece prometedor. Lo revisaré y ya puedo decir: este es el tipo de respuesta que impulsará a esta comunidad a un nivel de alta calidad. ¡Gracias!
El 21/7/18 parece que el enlace de descarga está roto y es posible que ya no sea compatible con la versión más reciente de Firefox.

Uso Bullzip PDF Printer , aunque solo lo he usado con Microsoft Word. La forma en que lo usa es que usa la función de impresión con la aplicación y selecciona la nueva impresora que se apacigua después de instalar Bullzip, cuando imprima le preguntará donde guardar el pdf

No estoy seguro de cuánto coincide con lo que debe tener en la lista, ya que solo lo uso para convertir documentos de Microsoft Word a .pdf, pero también instala una aplicación separada que puede usar para configurar la impresora, pero en mi opinión es esencialmente solo una impresora normal que genera un archivo digital en lugar de matar un árbol.