Британника и Мерриам-Вебстер подают в суд на OpenAI за нарушение авторских прав и ущерб репутации

Два столпа энциклопедических знаний, Britannica и Merriam-Webster, подали иск против OpenAI. Они утверждают о массовом использовании их защищенных статей для обучения моделей ИИ, таких как ChatGPT. Обвинение идет дальше начального обучения, указывая, что генерируемые ответы могут копировать буквальные фрагменты. Также вводится претензия о ущербе их бренду, когда ИИ совершает ошибки.

Una biblioteca digital en ruinas, con logos de Britannica y Merriam-Webster agrietados, mientras un haz de datos de IA los absorbe y genera texto plagado de errores.

RAG и запросы в реальном времени: где граница вдохновения? 🤔

Иск указывает на ключевой технический нюанс. Под вопросом не только начальный скрапинг данных, но и работа систем, использующих RAG (Retrieval-Augmented Generation). Эта техника запрашивает внешние базы данных в реальном времени для генерации ответов. Для истцов, когда ChatGPT использует этот метод и воспроизводит абзацы из их работ, происходит прямая копия, а не трансформационный процесс. Это переопределяет дебаты об нарушении на этапе инференса, а не только обучения.

Когда ИИ галлюцинирует и винит тебя 😅

Иск о нарушении закона о товарных знаках добавляет живописный поворот. Britannica утверждает, что ее репутация точности страдает, когда ChatGPT выдумывает данные или дает неверные ответы, которые пользователи могут ассоциировать с издателем. То есть, они не только берут контент без разрешения, но и заставляют нести ответственность за свои собственные бредни. Случай недозволенного присвоения credibility, с правом на истерику включительно.