Seit drei Jahrzehnten bewahrt das digitale Archiv Wayback Machine über eine Milliarde Webseiten und dient als unverzichtbares Werkzeug für Journalisten, Historiker und Anwälte. Doch die aktuelle Bedrohung kommt nicht von Regierungen oder Hackern, sondern von den Medien selbst. Laut der Nieman Foundation blockieren mindestens 241 Medien aus neun Ländern, darunter The Guardian, The New York Times und Le Monde, den Zugriff der Archiv-Crawler auf ihre Inhalte.
Das technische Dilemma zwischen Bewahrung und Datenschutz 🛡️
Der Grund für die Blockade ist die Befürchtung, dass KI-Unternehmen wie OpenAI oder Google dieses Material ohne Erlaubnis oder Vergütung zum Training ihrer Modelle nutzen könnten. Die New York Times klagte an, dass ihr Inhalt im Archiv von KI-Firmen unter Verletzung des Urheberrechts genutzt werde. Zudem senden KI-Bots Zehntausende von Anfragen pro Sekunde an die Server von archive.org und überlasten deren Infrastruktur. Die Organisation, die sich für ein offenes Internet einsetzt, steht vor der Herausforderung, ihre Philosophie aufrechtzuerhalten und sich gleichzeitig vor diesen Praktiken zu schützen.
Die Ironie, die Hand zu beißen, die einen beschützt 😅
Es ist paradox, dass Medien wie USA Today, die das Archiv nutzten, um ihre eigenen verlorenen Artikel wiederherzustellen, ihm nun die Tür verschließen. Es ist, als ob ein Feuerwehrmann dein Haus rettet und du ihm dann den Zutritt verbietest, weil du fürchtest, er könnte dein Sofa stehlen. Währenddessen stehen die KI-Bots virtuell Schlange, und archive.org, gefangen zwischen seiner altruistischen Mission und der Realität, wirkt wie der Gastgeber einer Party, zu der alle kommen wollen, aber niemand den Eintritt bezahlen möchte.