Per tre decenni, l'archivio digitale Wayback Machine ha preservato oltre un miliardo di pagine web, servendo come strumento essenziale per giornalisti, storici e avvocati. Ma la minaccia attuale non proviene da governi o hacker, bensì dai media stessi. Secondo la Nieman Foundation, almeno 241 media di nove paesi, come The Guardian, The New York Times e Le Monde, bloccano l'accesso dei crawler dell'archivio ai loro contenuti.
Il dilemma tecnico tra preservazione e protezione dei dati 🛡️
La ragione del blocco è il timore che aziende di intelligenza artificiale come OpenAI o Google utilizzino quel materiale per addestrare i loro modelli senza permesso né compenso. Il New York Times ha denunciato che i suoi contenuti nell'archivio sono utilizzati da aziende di IA violando i diritti d'autore. Inoltre, bot di IA inviano decine di migliaia di richieste al secondo ai server di archive.org, saturando la sua infrastruttura. L'organizzazione, che difende un internet aperto, affronta la sfida di mantenere la sua filosofia proteggendosi da queste pratiche.
L'ironia di mordere la mano che ti copre le spalle 😅
Risulta paradossale che media come USA Today, che hanno usato l'archivio per recuperare i propri articoli perduti, ora chiudano la porta. È come se un pompiere ti salvasse la casa e poi gli proibissi di entrare perché temi che ti rubi il divano. Nel frattempo, i bot di IA continuano a fare la fila virtuale, e archive.org, intrappolato tra la sua missione altruista e la realtà, sembra l'ospite di una festa a cui tutti vogliono andare, ma nessuno vuole pagare il biglietto.