Le grandi aziende tecnologiche hanno addestrato i loro modelli di intelligenza artificiale con libri, canzoni e contenuti di Internet senza chiedere autorizzazione. Più di 100 cause legali negli Stati Uniti accusano OpenAI, Google e Meta di violare i diritti d'autore. Ora i tribunali decidono se devono pagare licenze o cambiare il loro metodo di addestramento.
Il dilemma tecnico dello scraping di massa ⚖️
L'addestramento di modelli come GPT o Gemini si basa sullo scraping massivo di dati pubblici, un processo noto come web scraping. Le aziende sostengono che si tratti di uso equo, ma i querelanti affermano che equivale a copiare opere protette senza compenso. Se i giudici si pronunciano contro, le aziende dovranno optare per dati con licenza o modificare le loro architetture, aumentando i costi e rallentando lo sviluppo di nuove versioni.
L'arte di chiedere scusa prima del permesso 🤖
A quanto pare, l'intelligenza artificiale non è così intelligente da capire concetti basilari come chiedere il permesso. Mentre gli avvocati si sfregano le mani, le IA continuano a divorare contenuti altrui. Se alla fine dovranno pagare, forse i loro proprietari scopriranno che è più economico acquistare una licenza che pagare 100 cause legali. O magari passeranno all'arte generativa fatta con dati dei propri termini e condizioni.