Acabamos de cambiar nuestro sitio web para usar ssl en todas partes, pero esto está provocando que algunos contenidos incrustados no funcionen en los navegadores.
¿Hay alguna herramienta que pueda usar para rastrear todo el sitio en busca de este tipo de contenido roto (principalmente video) para poder repararlo o reemplazarlo? Hay suficiente contenido que hacer esto manualmente sería un trabajo duro. Ya uso linkchecker ocasionalmente para encontrar enlaces 404ing y demás, pero esto no encuentra incrustaciones rotas (afaik).
Sugiero intentar rastrear el sitio con Screamingfrog .
Verificaría los archivos de registro de su servidor web, según el formato (es decir, el formato de registro común de Apache), debería poder ver el código de estado (busque 404), el recurso solicitado pero no encontrado y la URL de referencia ( en qué página estaba el enlace/incrustación)
Si se supone que todo su contenido es https o ssl, entonces debería poder rastrear el sitio con Scrapy y buscar enlaces en el sitio, pero no el tipo correcto con Beautiful Soup 4 .
Simplemente use Scrapy para encontrar todas las páginas, analice con BS4 y verifique los elementos incrustados.
Tomás
feroxi
Mawg dice que reincorpore a Monica
essexboyracer
Mawg dice que reincorpore a Monica