본문 바로가기
비즈니스 & 테크

뉴욕 타임즈, 저작권 침해로 OpenAI와 Microsoft 고소

by 정보톡톡01 2023. 12. 30.

뉴욕타임스는 두 회사의 인공지능 기술이 수백만 건의 타임즈 기사를 불법으로 복사하여 ChatGPT 및 기타 서비스를 학습시켜 사람들에게 정보에 대한 즉각적인 액세스를 제공하는 기술(현재 타임즈와 경쟁하고 있는 기술)을 개발했다고 주장하며 저작권 침해 혐의로 OpenAI와 Microsoft를 고소했습니다.

 소송은 이른바 대규모 언어 인공 지능 모델을 학습시키기 위해 인터넷에서 광범위한 콘텐츠를 보상 없이 스크랩하는 행위를 제한하기 위한 일련의 소송 중 가장 최근에 제기된 소송입니다. 인터넷에 자신의 작품을 게시하는 배우, 작가, 언론인 및 기타 창작자들은 인공지능이 자신의 자료를 학습하여 적절한 보상 없이 경쟁력 있는 챗봇 및 기타 정보 소스를 제공할 것을 우려하고 있습니다.

그러나 뉴욕타임스의 소송은 주요 언론사 중 가장 잘 알려진 AI 브랜드인 OpenAI와 Microsoft를 상대로 소송을 제기한 최초의 사례입니다. Microsoft(MSFT)는 OpenAI의 이사회에 참여하고 있으며 이 회사에 수십억 달러를 투자했습니다.

수요일에 제출된 불만 사항에서 더 타임즈는 구독자들에게 이 사실을 알릴 의무가 있지만, 마이크로소프트와 OpenAI가 "더 타임즈와 경쟁하는 인공 지능 제품을 만들기 위해 더 타임즈의 작업을 불법적으로 사용함으로써 더 타임즈의 서비스 제공 능력이 위협받고 있다"고 말했습니다. 이 신문은 OpenAI와 Microsoft가 "광범위한 복제"에서 다른 소스를 사용했지만 "특히 더 타임즈 콘텐츠를 강조"하여 "허가나 대가 없이 대체 제품을 만드는 데 사용함으로써 저널리즘에 대한 더 타임즈의 막대한 투자에 무임승차"하려 했다고 지적했습니다.

"우리는 콘텐츠 제작자와 소유자의 권리를 존중하며, 이들이 AI 기술과 새로운 수익 모델의 혜택을 누릴 수 있도록 이들과 협력하기 위해 최선을 다하고 있습니다."라고 OpenAI의 린지 홀드 대변인은 성명에서 밝혔습니다. "뉴욕 타임즈와의 지속적인 대화는 생산적이고 건설적으로 진행되어 왔기 때문에 이번 사태에 대해 놀랍고 실망스럽습니다. 우리는 다른 많은 언론사와 마찬가지로 상호 이익이 되는 협력 방법을 찾을 수 있기를 희망합니다."

Microsoft는 소송에 대한 논평 요청에 응답하지 않았습니다.

더 타임스는 소장에서 몇 달 전 자사의 작업이 두 회사의 대규모 언어 모델 훈련에 사용되었다는 사실을 알게 되었을 때 이의를 제기했다고 밝혔습니다. 더 타임스는 4월부터 정당한 보상을 받고 계약 조건을 정하기 위해 OpenAI 및 Microsoft와 협상을 시작했다고 밝혔습니다.

그러나 뉴욕타임스는 두 회사와 합의에 이르지 못했다고 주장하고 있습니다. Microsoft와 OpenAI는 뉴욕타임즈의 저작물이 '공정한 사용'으로 간주되어 '변혁적 목적'을 위해 저작권이 있는 자료를 사용할 수 있다고 주장합니다.

뉴욕타임즈는 이러한 주장에 강력히 반대하며 ChatGPT와 마이크로소프트의 빙 챗봇('코파일럿'이라고도 함)이 뉴욕타임스와 유사한 서비스를 제공할 수 있다고 주장했습니다.

뉴욕타임스는 소장에서 "대가를 지불하지 않고 뉴욕타임스의 콘텐츠를 사용하여 뉴욕타임스를 대체하는 제품을 만들고 뉴욕타임스로부터 시청자를 빼앗는 것은 '혁신적'인 것이 아니다"라고 말했습니다. "피고의 GenAI 모델의 출력은 모델을 학습시키는 데 사용된 입력과 경쟁하고 거의 모방하기 때문에 이러한 목적을 위해 타임즈 작품을 복사하는 것은 공정 사용에 해당하지 않습니다."

AI에 대한 반발

더 타임스는 CNN을 비롯한 여러 주요 뉴스룸 중 하나로, 올해 초 웹사이트에 OpenAI의 웹 크롤러인 GPTBot이 자사 플랫폼에서 콘텐츠를 검색하는 것을 차단하는 코드를 추가했습니다.

올해 초 코미디언 사라 실버맨과 두 명의 저자는 7월에 Meta와 OpenAI를 상대로 두 회사의 AI 언어 모델이 자신도 모르게 또는 동의 없이 자신의 책에서 저작권이 있는 자료를 학습시켰다고 주장하며 별개이지만 관련된 소송을 제기했습니다. 두 회사 모두 이 소송에 대해 논평하지 않았습니다. 11월에 판사는 소송의 대부분의 주장을 기각했습니다.

또한 유명 소설 작가 그룹은 지난 9월에 작가 길드에 합류하여 OpenAI의 기술이 자신의 저작권이 있는 저작물을 불법적으로 사용하고 있다며 이 회사를 상대로 별도의 집단 소송을 제기했습니다.

뉴욕타임즈는 소송에서 자사의 AI 도구를 구동하는 최신 OpenAI 대규모 언어 모델을 훈련하는 데 사용된 데이터 세트가 "수백만 건의 타임즈 소유 저작물을 사용했을 가능성이 있다"고 주장했습니다. 소장에 따르면 이러한 데이터 세트 중 하나이며 '인터넷의 복사본'으로 알려진 커먼 크롤(Common Crawl)의 2019년 영문 스냅샷에서 뉴욕타임스 웹사이트는 위키백과와 미국 특허 문서 데이터베이스에 이어 세 번째로 많은 정보를 제공하는 출처로 나타났습니다.

The Times는 AI 도구가 자사 콘텐츠에 대한 학습을 거쳤기 때문에 "수많은 예시에서 알 수 있듯이 Times 콘텐츠를 그대로 낭독하고, 면밀히 요약하며, 표현 스타일을 모방하는 결과물을 생성할 수 있다"고 주장하며 "이러한 도구는 또한 잘못된 정보를 The Times에 잘못 귀속시킨다"고 고소장에 명시되어 있습니다.

반응형

AI 수용... 한계는 있지만

하지만 AI와 싸우는 것은 제방에 손가락을 집어넣는 것과 같습니다. 인공지능은 다가오고 있으며, 뉴욕 타임즈와 같은 언론사들은 미래를 받아들여야 한다는 것을 알고 있습니다. 뉴욕타임스는 언론인들이 공정한 보상을 받는 미래가 되기를 원할 뿐이라고 말합니다.

뉴욕타임스의 수석 부사장 겸 법률 고문인 다이앤 브레이튼은 수요일 아침 직원들에게 보낸 메모에서 "우리는 대중과 저널리즘을 위한 [제너레이티브 AI]의 잠재력을 인식하고 있습니다."라고 말했습니다.

CNN이 입수한 이 메모에 따르면, "그러나 동시에 우리는 GenAI와 이를 개발하는 회사의 성공이 언론 기관의 희생으로 이루어질 필요는 없다고 믿습니다."라고 말합니다. "GenAI 도구를 만들기 위해 우리의 저작물을 사용하려면 법이 규정하는 대로 해당 저작물의 공정한 가치를 반영하는 허가 및 계약이 수반되어야 합니다."

뉴욕타임스는 소송을 통해 수십억 달러의 손해배상을 청구하고 있지만, 저작권 침해 혐의에 대한 보상액은 구체적으로 밝히지 않았습니다. 또한, Microsoft와 OpenAI가 침해 행위를 계속하지 못하도록 영구적인 금지명령을 요청하고 있습니다. 더 타임즈는 또한 GPT와 저널리즘을 통합하는 다른 모든 AI 모델 또는 학습 데이터 세트의 '파기'를 요구하고 있습니다.

로펌 헤인즈 분의 인공지능 및 딥러닝 실무 그룹 파트너인 디나 블릭슈타인은 저작권이 있는 자료를 사용하여 AI 모델을 학습시키는 것이 법에 위배되는지 여부는 아직 해결되지 않은 법적 문제이기 때문에 타임즈 소송은 궁극적으로 더 넓은 업계에 선례가 될 수 있다고 말합니다.

블릭슈타인은 "이런 유형의 소송이 많이 제기될 것으로 생각하며, 결국 이 문제는 대법원까지 갈 것이고, 그 시점에는 명확한 판례가 나올 것이라고 생각합니다."라고 말하며, 현재로서는 "대규모 언어 모델과 AI가 너무 새롭다는 이유만으로 특별한 것은 없습니다."라고 덧붙였습니다.

2023년 12월 27일 수요일 오후 6시 2분 업데이트됨
반응형

댓글