Крупные технологические компании обучали свои модели искусственного интеллекта на книгах, песнях и интернет-контенте без запроса разрешения. Более 100 исков в США обвиняют OpenAI, Google и Meta в нарушении авторских прав. Теперь суды решают, должны ли они платить лицензионные отчисления или изменить свой метод обучения.
Техническая дилемма массового скрапинга ⚖️
Обучение таких моделей, как GPT или Gemini, основано на массовом сборе общедоступных данных — процессе, известном как веб-скрапинг. Компании утверждают, что это добросовестное использование, но истцы настаивают, что это равносильно копированию охраняемых произведений без компенсации. Если судьи вынесут решение не в их пользу, компаниям придётся либо использовать данные по лицензии, либо менять свои архитектуры, что повысит затраты и замедлит разработку новых версий.
Искусство просить прощения, а не разрешения 🤖
Оказывается, искусственный интеллект не настолько умён, чтобы понимать такие базовые понятия, как просьба о разрешении. Пока юристы потирают руки, ИИ продолжают поглощать чужой контент. Если в итоге им придётся платить, возможно, их владельцы обнаружат, что купить лицензию дешевле, чем оплачивать 100 исков. Или, возможно, они перейдут на генеративное искусство, созданное на основе данных из собственных условий использования.