대형 기술 기업들은 허가 없이 책, 노래, 인터넷 콘텐츠를 활용해 인공지능 모델을 훈련시켰습니다. 미국에서만 100건이 넘는 소송이 OpenAI, Google, Meta를 저작권 침해로 고소하고 있습니다. 이제 법원이 라이선스 비용을 지불해야 하는지, 아니면 훈련 방식을 변경해야 하는지 결정합니다.
대규모 스크래핑의 기술적 딜레마 ⚖️
GPT나 Gemini 같은 모델의 훈련은 웹 스크래핑이라는 공개 데이터의 대규모 수집에 기반합니다. 기업들은 이를 공정 사용이라고 주장하지만, 원고들은 보호받는 저작물을 보상 없이 복사하는 것과 같다고 주장합니다. 판사가 반대 판결을 내리면, 기업들은 라이선스 데이터를 선택하거나 아키텍처를 변경해야 하며, 이는 비용을 증가시키고 새 버전 개발을 지연시킬 것입니다.
허락보다 용서를 구하는 기술 🤖
알고 보면 인공지능은 허락을 구하는 기본 개념조차 이해할 만큼 똑똑하지 않습니다. 변호사들이 손을 비비는 동안, AI는 계속해서 타인의 콘텐츠를 삼키고 있습니다. 결국 비용을 지불해야 한다면, 소유주들은 100건의 소송을 감당하는 것보다 라이선스를 구매하는 것이 더 저렴하다는 사실을 깨달을지도 모릅니다. 아니면 자체 약관 데이터로 만든 생성 예술로 전환할 수도 있겠죠.