¿Cómo convierto un archivo Safari Webarchive en una carpeta?

Entiendo que un archivo web de Safari es un archivo único con el código fuente y otros recursos de una página web concatenados en un solo archivo. Encontré un artículo de Macworld de 2006 que describe un programa que hace exactamente esto, pero el enlace al programa ya no está actualizado.

¿Hay algún software actualmente disponible que pueda convertir un archivo web de Safari a un formato más estándar?

Respuestas (3)

WebArchive Extractor

Recomiendo WebArchiveExtractor. Puede arrastrar archivos .webarchive a esta aplicación que extraerá el archivo en sus archivos individuales en una carpeta.

Puede personalizar la salida en Preferencias, incluida la configuración de un nombre de archivo de índice personalizado:


WebArchiveExtractor es de código abierto en GitHub

A partir de junio de 2021, se compila perfectamente en Xcode (desde el enlace de arriba) y funciona muy bien.

WebArchive Extractor no funciona desde el 9 de diciembre de 2019. Uso macOS 10.14.4 (18E226) Mojave en un archivo .webarchive de Safari.
Parece funcionar perfectamente a partir de junio de 2021, ¡gracias por el consejo aquí!
funciona perfectamente a partir del 20 de junio de 2020, pruebe este enlace github.com/robrohan/WebArchiveExtractor/releases
Funciona bien en Big Sur / M1

¿Hay algún software actualmente disponible que pueda convertir un archivo web de Safari a un formato más estándar?

Si se siente cómodo con la línea de comandos, existe una herramienta textutilen Mac OS para convertir archivos webarchive a txt, html, rtf, rtfd, doc, docx, wordml u odt.

Ejemplo:
textutil -convert html /Users/USERNAME/NAME.webarchive


Para convertir un archivo web a pdf, pruebe "Wondershare PDF Editor for Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

La textutilherramienta de línea de comandos solo extrae el archivo html de nivel superior y no el CSS o los scripts que también forman parte del archivo web. (Que es realmente el objetivo del archivo web). No he encontrado una buena forma alternativa de hacer esto desde la línea de comandos.
@Stephen WebArchiveExtractor tiene una acción de Automator que se puede programar a través del shell.
A pesar de las advertencias, ese es el tipo de respuesta que estaba buscando. Una solución basada en GUI es bastante inútil cuando desea convertir cientos de archivos web en un servidor.
Esto ni siquiera extrae el archivo HTML original, sino que lo convierte. Realmente es más como abrir un archivo HTML en TextEdit y volver a exportarlo.

En realidad hay un software. El software es casi el mismo que el del enlace que proporcionó.

https://www.macupdate.com/app/mac/20643/webarchive-folderizer

Mac OS X 10.2 o posterior: Intel/PPC

Funcionó muy bien para mí en El Capitán.