Hice algo "increíble" en un sitio web y mi lado narcisista quiere una prueba para la posteridad de que logré hacerlo, incluso si el sitio web en cuestión decide cambiar sus reglas o se desconecta.
Por ejemplo, lo que me inspiró a hacer esta pregunta fue una racha de 100 años en GitHub https://stackoverflow.com/questions/20099235/who-is-the-user-with-the-longest-streak-on-github/27742165 que podría desaparecer sin pruebas en cualquier momento, ya que GitHub generalmente simplemente realiza modificaciones más pequeñas en su back-end sin informar a nadie. Y las capturas de pantalla que subo yo mismo son obviamente triviales de falsificar.
Pero puedo ver que esto tiene aplicaciones más serias, como servir como evidencia legal que es más simple que citar los registros del servidor, o cuando estos son inaccesibles (por ejemplo, en un país extranjero). Aunque ya ha sido declinado en la corte una vez .
Si tan solo hubiera un servicio web, en el que ingreso una URL, haga clic en un botón, e inmediatamente:
http://snapshot.com/view/2015-01-01/http://github.com
, o simplemente agregar un encabezado personalizadoCaracterísticas no obligatorias que estarían bien:
robots.txt
cuando hago una solicitud manual. No es bueno rastrear esos sitios web, pero no veo por qué no tomar una instantánea a pedido, que es como si yo cargara la página. Motivo original: demostrar que un sitio web estaba en la posición N en una búsqueda de Google: https://web.archive.org/web/https://www.google.com/search?q=x86+paging+tutorial archive.is actualmente hace esto: https://archive.is/vkc8BPor supuesto, todo el sistema dependería de la creencia de que el servicio web en cuestión no está haciendo trampa, lo cual, aunque no es lo ideal, es aceptable para mí.
Lo que he encontrado hasta ahora:
Creo que icanprove.com podría satisfacer sus necesidades.
Las capturas de pantalla no se presentan en línea. Se almacenan en archivos PDF firmados, por lo que debe cargarlos usted mismo, pero por otro lado, esto le brinda más control.
Ofrece un navegador remoto virtual (una versión anterior de Firefox) dentro de su navegador que le permite autenticarse en sitios web. Por supuesto, debe confiar en ese servicio con sus contraseñas. Tenga en cuenta que hay cierto retraso entre la pulsación de las teclas y su efecto en el navegador remoto, pero se puede utilizar.
Después de consultar las preguntas frecuentes de archive.org , descubrí que tiene un cuadro "Guardar página ahora" en https://archive.org/web/ ...
Encontré esto después de notar que si una página no se había rastreado cuando la buscas, sugiere: "¿Quieres tomar una instantánea ahora?"
Esto lo convierte en la mejor opción hasta el momento, ya que también tiene una de las operaciones opcionales: guardar PDF y se siente más preparado para el futuro que archive.today
. ejemplo _
#
, por lo que si una página se muestra de manera diferente según el valor de los caracteres después de #
, archive.org no funcionará.Como mencionó @Parcier, archive.is hace lo que quiero.
Almacena capturas de pantalla y HTML, y dice la fecha.
Por ejemplo, instantánea que acabo de tomar de GitHub: https://archive.today/eN836
No parece tener ninguna de las características no obligatorias.
El creador dijo en marzo de 2015 que no realizan la autenticación: http://blog.archive.today/post/114635965191/you-should-allow-users-to-send-cookie-strings-to luego apunta a http ://www.peeep.us/ pero parece muerto.
Tampoco pude encontrar la personalización de la solicitud y las pruebas de PDF fallaron para mí.
Para obtener listas relevantes, consulte: https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives y http://alternativeto.net/software/archive-is/
marcapasos
Ciro Santilli OurBigBook.com
marcapasos
Ciro Santilli OurBigBook.com
ᔕᖺᘎᕊ
marcapasos