Два столпа энциклопедических знаний, Britannica и Merriam-Webster, подали иск против OpenAI. Они утверждают о массовом использовании их защищенных статей для обучения моделей ИИ, таких как ChatGPT. Обвинение идет дальше начального обучения, указывая, что генерируемые ответы могут копировать буквальные фрагменты. Также вводится претензия о ущербе их бренду, когда ИИ совершает ошибки.
RAG и запросы в реальном времени: где граница вдохновения? 🤔
Иск указывает на ключевой технический нюанс. Под вопросом не только начальный скрапинг данных, но и работа систем, использующих RAG (Retrieval-Augmented Generation). Эта техника запрашивает внешние базы данных в реальном времени для генерации ответов. Для истцов, когда ChatGPT использует этот метод и воспроизводит абзацы из их работ, происходит прямая копия, а не трансформационный процесс. Это переопределяет дебаты об нарушении на этапе инференса, а не только обучения.
Когда ИИ галлюцинирует и винит тебя 😅
Иск о нарушении закона о товарных знаках добавляет живописный поворот. Britannica утверждает, что ее репутация точности страдает, когда ChatGPT выдумывает данные или дает неверные ответы, которые пользователи могут ассоциировать с издателем. То есть, они не только берут контент без разрешения, но и заставляют нести ответственность за свои собственные бредни. Случай недозволенного присвоения credibility, с правом на истерику включительно.