Herramientas para encontrar contenido incrustado roto

Acabamos de cambiar nuestro sitio web para usar ssl en todas partes, pero esto está provocando que algunos contenidos incrustados no funcionen en los navegadores.

¿Hay alguna herramienta que pueda usar para rastrear todo el sitio en busca de este tipo de contenido roto (principalmente video) para poder repararlo o reemplazarlo? Hay suficiente contenido que hacer esto manualmente sería un trabajo duro. Ya uso linkchecker ocasionalmente para encontrar enlaces 404ing y demás, pero esto no encuentra incrustaciones rotas (afaik).

¿Puede ampliar lo que quiere decir con contenido incrustado roto en los navegadores?
Videos en su mayor parte, que el navegador no cargará debido a que son de una URL no SSL. Termina dejando un área en blanco en la página.
¿Probaste el enlace detective de Xenu? Ha existido durante décadas y funciona bien para mí - home.snafu.de/tilman/xenulink.html
¿Está utilizando un CMS para potenciar el sitio web? Por ejemplo, WordPress, si tal vez busca una herramienta escrita para ese CMS para escanear la base de datos y cambiar el protocolo por usted. Por ejemplo , https://interconnectit.com/products/search-and-replace-for-wordpress-databases/ .
¿Encontraste alguna solución?

Respuestas (3)

Sugiero intentar rastrear el sitio con Screamingfrog .

Verificaría los archivos de registro de su servidor web, según el formato (es decir, el formato de registro común de Apache), debería poder ver el código de estado (busque 404), el recurso solicitado pero no encontrado y la URL de referencia ( en qué página estaba el enlace/incrustación)

Si se supone que todo su contenido es https o ssl, entonces debería poder rastrear el sitio con Scrapy y buscar enlaces en el sitio, pero no el tipo correcto con Beautiful Soup 4 .

Simplemente use Scrapy para encontrar todas las páginas, analice con BS4 y verifique los elementos incrustados.