Искусственный интеллект без разрешения: сто исков за использование ваших данных без лицензии

Крупные технологические компании обучали свои модели искусственного интеллекта на книгах, песнях и интернет-контенте без запроса разрешения. Более 100 исков в США обвиняют OpenAI, Google и Meta в нарушении авторских прав. Теперь суды решают, должны ли они платить лицензионные отчисления или изменить свой метод обучения.

Фотореалистичная кинематографическая сцена, изображающая массивный светящийся мозг нейросети, состоящий из плавающих книжных страниц, нот и цифровых иконок, пронзённый роем красных стрелок юридических документов с символами авторского права, в то время как роботизированные руки от логотипов OpenAI, Google и Meta тянутся к потоку данных без разрешения, на заднем плане парит судейский молоток, драматические тени, контраст синего и красного освещения, сверхдетализированный стиль технической иллюстрации, высококонтрастное объёмное освещение, рендер 8k

Техническая дилемма массового скрапинга ⚖️

Обучение таких моделей, как GPT или Gemini, основано на массовом сборе общедоступных данных — процессе, известном как веб-скрапинг. Компании утверждают, что это добросовестное использование, но истцы настаивают, что это равносильно копированию охраняемых произведений без компенсации. Если судьи вынесут решение не в их пользу, компаниям придётся либо использовать данные по лицензии, либо менять свои архитектуры, что повысит затраты и замедлит разработку новых версий.

Искусство просить прощения, а не разрешения 🤖

Оказывается, искусственный интеллект не настолько умён, чтобы понимать такие базовые понятия, как просьба о разрешении. Пока юристы потирают руки, ИИ продолжают поглощать чужой контент. Если в итоге им придётся платить, возможно, их владельцы обнаружат, что купить лицензию дешевле, чем оплачивать 100 исков. Или, возможно, они перейдут на генеративное искусство, созданное на основе данных из собственных условий использования.