Las grandes tecnológicas han entrenado sus modelos de inteligencia artificial con libros, canciones y contenido de internet sin pedir autorización. Más de 100 demandas en EE. UU. acusan a OpenAI, Google y Meta de violar derechos de autor. Ahora los tribunales deciden si deben pagar licencias o cambiar su método de entrenamiento.
El dilema técnico del scraping masivo ⚖️
El entrenamiento de modelos como GPT o Gemini se basa en el rastreo masivo de datos públicos, un proceso conocido como web scraping. Las empresas argumentan que es uso justo, pero los demandantes sostienen que equivale a copiar obras protegidas sin compensación. Si los jueces fallan en contra, las compañías deberán optar por datos con licencia o cambiar sus arquitecturas, lo que elevaría costos y ralentizaría el desarrollo de nuevas versiones.
El arte de pedir perdón antes que permiso 🤖
Resulta que la inteligencia artificial no es tan lista para entender conceptos básicos como pedir permiso. Mientras los abogados se frotan las manos, las IAs siguen devorando contenido ajeno. Si al final tienen que pagar, quizá sus dueños descubran que es más barato comprar una licencia que pagar 100 demandas. O igual se pasan al arte generativo hecho con datos de sus propios términos y condiciones.