Dos pilares del conocimiento enciclopédico, Britannica y Merriam-Webster, han presentado una demanda contra OpenAI. Alegan un uso masivo de sus artículos protegidos para entrenar modelos de IA como ChatGPT. La acusación va más allá del entrenamiento inicial, señalando que las respuestas generadas pueden copiar fragmentos literales. También introducen una reclamación por daño a su marca cuando la IA comete errores.
El RAG y la consulta en tiempo real: ¿dónde está el límite de la inspiración? 🤔
La demanda señala un matiz técnico crucial. No solo se cuestiona el scraping inicial de datos, sino el funcionamiento de sistemas que usan RAG (Retrieval-Augmented Generation). Esta técnica consulta bases de datos externas en tiempo real para generar respuestas. Para los demandantes, cuando ChatGPT usa este método y reproduce párrafos de sus obras, se produce una copia directa y no un proceso transformativo. Esto redefine el debate sobre la infracción en el momento de la inferencia, no solo del entrenamiento.
Cuando la IA alucina y te echa la culpa a ti 😅
La demanda por violación de la ley de marcas añade un giro pintoresco. Britannica argumenta que su reputación de precisión se ve manchada cuando ChatGPT inventa datos o da respuestas erróneas que los usuarios pueden asociar a la editorial. Es decir, no solo tomarían el contenido sin permiso, sino que además les harían responsable de sus propios desvaríos. Un caso de apropiación indebida de credibilidad, con derecho a pataleta incluido.