Biblioteca permanente de Pocket sin suscripción

Uso Pocket e Instapaper para almacenar artículos para leerlos más tarde. Pero algunos artículos que encuentro en la web son tan útiles que quiero una copia permanente de ellos. Pocket admite esto con una suscripción, pero estoy buscando una manera de hacerlo con una compra única para no tener que preocuparme por perder la base de datos si dejo que mi suscripción caduque.

Idealmente, tendría las siguientes características:

  • Guarde la fuente del artículo web en un formato que no requiera que la aplicación lo lea (en caso de que se abandone el desarrollo de la aplicación)
  • Debe ejecutarse en macOS, pero si también hay una versión de iOS, sería bueno
  • Ser capaz de renderizar el artículo (es decir, renderizar el HTML)
  • Tener la capacidad de etiquetar artículos por tema.
  • Tener la capacidad de realizar búsquedas de texto completo en el contenido del artículo.
¿Estaría dispuesto a autohospedar una solución? Entonces un clon de Pocket como Wallabag podría funcionar.
@Izzy Ingrese eso como respuesta. Voy a intentar instalarlo hoy en mi servidor web y probarlo.

Respuestas (2)

Si está dispuesto a hospedar la parte del servidor, Wallabag podría ser su elección. Es gratuito y de código abierto (encuéntrelo en Github ) y cumpliría con sus requisitos:

  • Guarde la fuente del artículo web en un formato que no requiera que la aplicación lea: no estoy seguro de cómo se guarda exactamente, pero está en su propia base de datos para exportar
  • Debe ejecutarse en macOS, pero si también hay una versión de iOS, sería bueno: como se ejecuta como un servicio web, puede acceder desde cualquier dispositivo o sistema operativo simplemente usando su navegador web. Si lo desea, también hay un complemento para Firefox y otro para Chrome , una aplicación para Android (disponible en F-Droid y Google Play ) y una para iPhone .
  • Ser capaz de renderizar el artículo (es decir, renderizar el HTML): Claro, ver más abajo :)
  • Tener la capacidad de etiquetar artículos por tema: Sí, cotizar: Organizar el contenido: etiquetas, favoritos, filtros, …
  • Tener la capacidad de realizar búsquedas de texto completo en el contenido del artículo: tiene una función de búsqueda, pero no sé qué tan profunda es. Si no, está en su base de datos, por lo que puede agregarlo.

Página de inicio de Wallabag Filtro de bolsa de papel
Página de inicio y filtros de Wallabag (fuente: Wallabag ; haga clic en las imágenes para ver variantes más grandes)

Desde hace un tiempo he estado usando Zotero para esto. Fue diseñado para ayudar a los investigadores a organizar los documentos que desean consultar, pero también tiene la capacidad de tomar "instantáneas" de páginas web y almacenarlas en su biblioteca. Funciona como un complemento del navegador que solo le brinda un ícono en la barra de herramientas para guardar una página web. Hay un programa "independiente" separado que administra su biblioteca.

Con respecto a su desiderata:

1) Guarda el HTML del artículo, es decir, la página web tal como existe en el sitio, por lo que no está vinculada a ninguna aplicación en particular. Sin embargo, el esquema para almacenar estos archivos en el disco es bastante opaco; se almacenan en un árbol de directorios con nombres poco informativos como "ICPQA6PS". Esto significa que podría ser difícil localizar un artículo en particular si no tuviera Zotero. Por otro lado, dado que son solo archivos, puede usar las capacidades de búsqueda ordinarias del sistema operativo para encontrar el archivo. De cualquier manera, una vez que encuentre el archivo, puede abrirlo con un navegador web como de costumbre.

2) No lo he usado en Mac, pero el sitio dice que hay una versión para Mac de Zotero independiente. El complemento del navegador debería funcionar en cualquier sistema operativo.

3) Zotero no renderiza el artículo en sí. En cambio, como se mencionó anteriormente, guarda el HTML. El programa proporciona una forma de reabrir el artículo, pero eso solo lo abre con su navegador web, no dentro de Zotero. (Puede optar por volver a cargar la página original que visitó o abrir la instantánea guardada).

4) Puede etiquetar cualquier elemento con lo que quiera y filtrar/buscar por etiquetas.

5) Desafortunadamente no cumple con este criterio. Aparentemente, tiene la capacidad de buscar dentro de archivos PDF (si lo que guardó fue un PDF "bueno" y no, digamos, un escaneo deficiente), y puede buscar dentro de títulos y "resúmenes" (que completa con cosas como el subtítulo para artículos de noticias).

Tiene algunas desventajas:

1) No siempre captura las páginas correctamente. Por lo general, el problema ocurre si la página usa muchas secuencias de comandos y/o está detrás de un muro de pago. Aparentemente, algunos sitios hacen un gran esfuerzo para evitar que las personas guarden sus páginas de manera efectiva. Si una página en particular es importante para usted, asegúrese de revisar la instantánea para ver si realmente tiene el contenido. Además, en mi experiencia, incluso si la instantánea parece no ser válida (p. ej., cuando la ve dice "Debe iniciar sesión" o similar), a menudo el contenido del artículo está ahí pero oculto en algún lugar del marcado de la página, por lo que si realmente lo necesitaba, probablemente podría sacarlo. (Vale la pena señalar que, según mi experiencia, prácticamente todo el software que intenta guardar una página web sufre este problema hasta cierto punto.

2) Requiere coordinar su actividad entre el navegador y el programa independiente. Para guardar el artículo, debe hacer clic en el botón de la barra de herramientas del navegador, pero para hacer cualquier otra cosa (por ejemplo, agregar etiquetas, buscar en su biblioteca) debe usar el programa independiente. En general, me he acostumbrado a esto, pero quizás no sea lo ideal. (El complemento de Firefox de Zotero solía tener la capacidad de administrar la biblioteca desde Firefox, pero esto fue eliminado por la execrable decisión de Mozilla de destripar el sistema de extensión de Firefox).

También tiene algunas características útiles que no mencionaste específicamente. Las funciones para administrar, ordenar, buscar y, en general, organizar su biblioteca son bastante completas. Por lo general, puede extraer automáticamente una cantidad considerable de metadatos útiles (p. ej., si visita un sitio de noticias y guarda la página, a menudo descubrirá el autor, la publicación, etc., y los colocará en las ranuras de metadatos correspondientes). Debido a que fue diseñado con fines de investigación, también proporciona herramientas para exportar citas, etc. Finalmente, nuevamente debido a su pedigrí de investigación, es especialmente bueno si está guardando cosas como artículos científicos; tiene procesadores incorporados para propósitos especiales para muchos sitios web de publicaciones científicas (como Elsevier) de modo que si guarda un artículo, descargará y guardará automáticamente la versión en PDF y la vinculará a los metadatos.

No es perfecto, pero es bastante útil en general.