Servicio web que sirve como prueba pública de que una URL determinada contiene algo en un momento dado

Hice algo "increíble" en un sitio web y mi lado narcisista quiere una prueba para la posteridad de que logré hacerlo, incluso si el sitio web en cuestión decide cambiar sus reglas o se desconecta.

Por ejemplo, lo que me inspiró a hacer esta pregunta fue una racha de 100 años en GitHub https://stackoverflow.com/questions/20099235/who-is-the-user-with-the-longest-streak-on-github/27742165 que podría desaparecer sin pruebas en cualquier momento, ya que GitHub generalmente simplemente realiza modificaciones más pequeñas en su back-end sin informar a nadie. Y las capturas de pantalla que subo yo mismo son obviamente triviales de falsificar.

Pero puedo ver que esto tiene aplicaciones más serias, como servir como evidencia legal que es más simple que citar los registros del servidor, o cuando estos son inaccesibles (por ejemplo, en un país extranjero). Aunque ya ha sido declinado en la corte una vez .

Si tan solo hubiera un servicio web, en el que ingreso una URL, haga clic en un botón, e inmediatamente:

  • obtener el HTML y todas sus dependencias
  • hacer que la página web original sea visible en una URL pública del sitio web duplicado. Almacenar una captura de pantalla solo en lugar del HTML original sería aceptable, pero no ideal.
  • asocie una marca de tiempo y una URL, de manera que no pueda cambiarla después. Por ejemplo, podría codificar esa información en la URL como http://snapshot.com/view/2015-01-01/http://github.com, o simplemente agregar un encabezado personalizado

Características no obligatorias que estarían bien:

  • Autenticación. No estoy seguro de si es técnicamente factible.
  • enviar una solicitud HTTP arbitraria en lugar de un simple GET
  • recuperar otros tipos de medios HTML, en PDF especial. archive.org hace esto .
  • ignorar robots.txtcuando hago una solicitud manual. No es bueno rastrear esos sitios web, pero no veo por qué no tomar una instantánea a pedido, que es como si yo cargara la página. Motivo original: demostrar que un sitio web estaba en la posición N en una búsqueda de Google: https://web.archive.org/web/https://www.google.com/search?q=x86+paging+tutorial archive.is actualmente hace esto: https://archive.is/vkc8B
  • archivar la página incluso si da 500. Se puede usar como prueba de que encontré un error. archive.org no parece hacer esto.

Por supuesto, todo el sistema dependería de la creencia de que el servicio web en cuestión no está haciendo trampa, lo cual, aunque no es lo ideal, es aceptable para mí.

Lo que he encontrado hasta ahora:

  • Máquina Wayback: http://archive.org/web/ . Si tan solo hubiera un botón que pudiera presionar para generar una instantánea cuando lo desee, resolvería mi problema
  • muchos sitios web que toman una URL y la convierten en una imagen, pero ninguno que almacena la imagen en su servidor y le asigna una marca de tiempo y una URL de origen
¿ Archive.org cumple con sus requisitos?
@Pacerier como se menciona en la pregunta, AFAIK no porque no pude encontrar un botón para tomar una instantánea cuando quiera
@Pacerier que funcionó. Lo he probado y he añadido un poco de información. Respondido como un wiki de la comunidad, por lo que no tendré un representante en la espalda. Responda directamente la próxima vez con tan buenas sugerencias. Salud.
@Pacerier Una alternativa es que también responda y obtenga su representante :)
@CiroSantilli六四事件法轮功, El representante te pertenece. Acabo de señalar los enlaces, no hice ninguna evaluación .

Respuestas (3)

Creo que icanprove.com podría satisfacer sus necesidades.

Las capturas de pantalla no se presentan en línea. Se almacenan en archivos PDF firmados, por lo que debe cargarlos usted mismo, pero por otro lado, esto le brinda más control.

Ofrece un navegador remoto virtual (una versión anterior de Firefox) dentro de su navegador que le permite autenticarse en sitios web. Por supuesto, debe confiar en ese servicio con sus contraseñas. Tenga en cuenta que hay cierto retraso entre la pulsación de las teclas y su efecto en el navegador remoto, pero se puede utilizar.

esto es genial ¿Entiendes cómo funciona su método de firma?
Para ver la firma hay que abrir los pdf con Adobe Reader (no con el plugin). Para que Adobe "acepte" la firma, debe configurarlo para que confíe en los certificados de su sistema operativo.
¿Parece que no hay una implementación gratuita para verificar archivos PDF en Linux? askubuntu.com/questions/226257/… Adobe describe el método en: adobe.com/devnet-docs/acrobatetk/tools/DigSig/… , estándar PKI + RSA/DSA.
@MartinLoehnertz, ¿Algún descargo de responsabilidad?
Como esto todavía es algo experimental, muchos descargos de responsabilidad -> ver descargos de responsabilidad :-). Los inversores que podrían proporcionar el músculo legal necesario aún no se han presentado (a pesar de algunos lanzamientos). Pero sigo confiando en que solo es cuestión de paciencia.

Después de consultar las preguntas frecuentes de archive.org , descubrí que tiene un cuadro "Guardar página ahora" en https://archive.org/web/ ...

Encontré esto después de notar que si una página no se había rastreado cuando la buscas, sugiere: "¿Quieres tomar una instantánea ahora?"

Esto lo convierte en la mejor opción hasta el momento, ya que también tiene una de las operaciones opcionales: guardar PDF y se siente más preparado para el futuro que archive.today. ejemplo _

También en lifehacker.com/…
Argh, descubrí que tiene una limitación. Ignora todo lo que está después de #, por lo que si una página se muestra de manera diferente según el valor de los caracteres después de #, archive.org no funcionará.

Como mencionó @Parcier, archive.is hace lo que quiero.

Almacena capturas de pantalla y HTML, y dice la fecha.

Por ejemplo, instantánea que acabo de tomar de GitHub: https://archive.today/eN836

No parece tener ninguna de las características no obligatorias.

El creador dijo en marzo de 2015 que no realizan la autenticación: http://blog.archive.today/post/114635965191/you-should-allow-users-to-send-cookie-strings-to luego apunta a http ://www.peeep.us/ pero parece muerto.

Tampoco pude encontrar la personalización de la solicitud y las pruebas de PDF fallaron para mí.

Para obtener listas relevantes, consulte: https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives y http://alternativeto.net/software/archive-is/