Vous cliquez sur un lien… et vous tombez sur une page d’erreur 404 plutôt que sur la page que vous vouliez lire. Ce « lien rompu » est un exemple de « détissage » de la Toile, un phénomène provoqué par le déplacement ou la suppression des pages web, qui toucherait plus de la moitié des liens. Mais ce n’est pas une fatalité : Mozilla entend le combattre avec le concours de l’Internet Archive.
L’association se consacre à l’archivage du web depuis 1996 : sa Wayback Machine enregistre plus de 20 To de pages web chaque semaine, pour un total approchant les 10 Po d’archives et 500 milliards de pages. Des chiffres impressionnants, mais l’Internet Archive est loin d’être exhaustive, et des millions de pages web ont sans doute été perdues à jamais.
Reste que cette archive est à ce point étendue qu’elle contient une ou plusieurs versions de nombreuses pages dont les liens pointent aujourd’hui vers des erreurs 404. C’est là que Mozilla entre en jeu : avec l’extension No More 404s du module Test Pilot, Firefox est capable de répondre à une erreur 404 avec un lien vers une archive de la Wayback Machine.
Cette extension ne résout pas le problème plus sournois des redirections, mais elle a l’avantage de la simplicité et de la rapidité. Pour des besoins plus complexes, le site gHacks pointe vers le module Resurrect Pages, qui exploite non seulement l’Internet Archive, mais aussi WebCite et archive.is.