तीन दशकों तक, डिजिटल संग्रह वेबैक मशीन ने एक अरब से अधिक वेब पेजों को संरक्षित किया है, जो पत्रकारों, इतिहासकारों और वकीलों के लिए एक आवश्यक उपकरण के रूप में कार्य करता है। लेकिन वर्तमान खतरा सरकारों या हैकर्स से नहीं, बल्कि स्वयं मीडिया आउटलेट्स से आता है। नीमैन फाउंडेशन के अनुसार, नौ देशों के कम से कम 241 मीडिया आउटलेट, जैसे द गार्जियन, द न्यूयॉर्क टाइम्स और ले मोंडे, अपनी सामग्री तक संग्रह के क्रॉलर की पहुंच को अवरुद्ध कर रहे हैं।
संरक्षण और डेटा सुरक्षा के बीच तकनीकी दुविधा 🛡️
अवरोध का कारण यह डर है कि OpenAI या Google जैसी कृत्रिम बुद्धिमत्ता कंपनियां अनुमति या मुआवजे के बिना अपने मॉडलों को प्रशिक्षित करने के लिए उस सामग्री का उपयोग कर सकती हैं। न्यूयॉर्क टाइम्स ने आरोप लगाया कि संग्रह में उनकी सामग्री का उपयोग AI फर्मों द्वारा कॉपीराइट का उल्लंघन करते हुए किया जा रहा है। इसके अलावा, AI बॉट archive.org के सर्वरों पर प्रति सेकंड दसियों हज़ार अनुरोध भेजते हैं, जिससे उनका बुनियादी ढांचा संतृप्त हो जाता है। संगठन, जो एक खुले इंटरनेट की वकालत करता है, इन प्रथाओं से खुद को बचाते हुए अपने दर्शन को बनाए रखने की चुनौती का सामना करता है।
उस हाथ को काटने की विडंबना जो आपकी पीठ थपथपाता है 😅
यह विरोधाभासी है कि USA Today जैसे मीडिया आउटलेट, जिन्होंने अपने खोए हुए लेखों को पुनर्प्राप्त करने के लिए संग्रह का उपयोग किया, अब दरवाजा बंद कर रहे हैं। यह ऐसा है जैसे कोई फायरमैन आपके घर को बचाता है और फिर आप उसे प्रवेश करने से मना करते हैं क्योंकि आपको डर है कि वह आपका सोफा चुरा लेगा। इस बीच, AI बॉट आभासी कतार में लगे रहते हैं, और archive.org, अपने परोपकारी मिशन और वास्तविकता के बीच फंसा हुआ, एक ऐसी पार्टी के मेज़बान की तरह दिखता है जिसमें हर कोई आना चाहता है, लेकिन कोई प्रवेश शुल्क नहीं देना चाहता।