Dos pilares del conocimiento enciclopédico, Britannica y Merriam-Webster, han presentado una demanda contra OpenAI. Alegan un uso masivo de sus artículos protegidos para entrenar modelos de IA como ChatGPT. La acusación va más allá del entrenamiento inicial, señalando que las respuestas generadas pueden copiar fragmentos literales. También introducen una reclamación por daño a su marca cuando la IA comete errores.

Una biblioteca digital en ruinas, con logos de Britannica y Merriam-Webster agrietados, mientras un haz de datos de IA los absorbe y genera texto plagado de errores.

El RAG y la consulta en tiempo real: ¿dónde está el límite de la inspiración? 🤔

La demanda señala un matiz técnico crucial. No solo se cuestiona el scraping inicial de datos, sino el funcionamiento de sistemas que usan RAG (Retrieval-Augmented Generation). Esta técnica consulta bases de datos externas en tiempo real para generar respuestas. Para los demandantes, cuando ChatGPT usa este método y reproduce párrafos de sus obras, se produce una copia directa y no un proceso transformativo. Esto redefine el debate sobre la infracción en el momento de la inferencia, no solo del entrenamiento.

Cuando la IA alucina y te echa la culpa a ti 😅

La demanda por violación de la ley de marcas añade un giro pintoresco. Britannica argumenta que su reputación de precisión se ve manchada cuando ChatGPT inventa datos o da respuestas erróneas que los usuarios pueden asociar a la editorial. Es decir, no solo tomarían el contenido sin permiso, sino que además les harían responsable de sus propios desvaríos. Un caso de apropiación indebida de credibilidad, con derecho a pataleta incluido.

Britannica y Merriam-Webster demandan a OpenAI por copyright y daño reputacional

El RAG y la consulta en tiempo real: ¿dónde está el límite de la inspiración? 🤔

Cuando la IA alucina y te echa la culpa a ti 😅