Le paradoxe de Wayback Machine : ses sauveurs lui ferment désormais la porte

25 April 2026 Publié | Traduit de l'espagnol

Pendant trois décennies, l'archive numérique Wayback Machine a préservé plus d'un milliard de pages web, servant d'outil essentiel pour les journalistes, les historiens et les avocats. Mais la menace actuelle ne vient pas des gouvernements ou des pirates, mais des médias eux-mêmes. Selon la Nieman Foundation, au moins 241 médias de neuf pays, comme The Guardian, The New York Times et Le Monde, bloquent l'accès des robots d'exploration de l'archive à leur contenu.

Illustration conceptuelle : un robot archiviste numérique en forme de bibliothèque, mais avec des portes fermées par des journaux géants qui le bloquent, symbolisant le paradoxe médiatique.

Le dilemme technique entre préservation et protection des données 🛡️

La raison du blocage est la crainte que des entreprises d'intelligence artificielle comme OpenAI ou Google utilisent ce matériel pour entraîner leurs modèles sans autorisation ni compensation. Le New York Times a dénoncé que son contenu dans l'archive est utilisé par des firmes d'IA en violation des droits d'auteur. De plus, les robots d'IA envoient des dizaines de milliers de requêtes par seconde aux serveurs d'archive.org, saturant leur infrastructure. L'organisation, qui défend un internet ouvert, fait face au défi de maintenir sa philosophie tout en se protégeant de ces pratiques.

L'ironie de mordre la main qui te protège le dos 😅

Il est paradoxal que des médias comme USA Today, qui ont utilisé l'archive pour récupérer leurs propres articles perdus, ferment désormais la porte. C'est comme si un pompier sauvait ta maison et que tu lui interdisais d'entrer de peur qu'il te vole le canapé. Pendant ce temps, les robots d'IA continuent de faire la queue virtuelle, et archive.org, pris entre sa mission altruiste et la réalité, semble l'hôte d'une fête à laquelle tout le monde veut aller, mais personne ne veut payer l'entrée.