본문
최근 미국 연방법원은 Bartz v. Anthropic, Kadrey v. Meta, Thomson Reuters v. Ross Intelligence 사건을 통해 AI 학습을 위한 저작물 이용이 공정이용(fair use) 원칙에 부합하는지에 관한 중요한 법리적 판단 기준을 제시했습니다. 각 사건에서 연방 법원이 공정이용 원칙을 적용함에 있어 AI 훈련 데이터 수집 방식의 적법성, 원저작물 시장에 대한 영향, 변형적 이용의 범위 등의 요건을 판단하면서 변형적 이용여부에 대한 결론을 내렸습니다. 이러한 판례들을 통해 확인이 되는 공정이용에 대한 판단기준과 그 결과는 국내외 AI 저작권 분쟁에 상당한 시시점을 제공합니다.
1. 배경: 생성형 AI와 저작권 분쟁
2. 공정이용 원칙과 그 중요성
3. 판례 분석
4. 시사점
1. 배경: 생성형 AI와 저작권 분쟁
생성형 AI 기술의 급속한 발전에 따라 AI 기술의 훈련에 사용된 학습 데이터가 저작권법상 창작자의 배타적 권리를 침해하는지 여부에 대한 법적 논쟁이 미국 전역에서 활발히 이어지고 있습니다. 2025년 6월 30일 기준, 미국에서는 생성형 AI 기업들을 상대로 총 47건의 저작권 침해 소송이 제기되었으며, 현재 자발적으로 취하된 사건들을 제외하고 44건의 소송이 계류 중인 상태입니다.
이러한 배경에서 2025년 6월, 캘리포니아 북부연방지방법원은 Bartz v. Anthropic 사건과 Kadrey v. Meta 사건에서 AI 학습을 위한 저작물 이용이 공정이용에 해당한다는 판결을 연달아 내리며 생성형 AI 기업들의 손을 들어주었습니다. 물론, 2025년 2월 Thomson Reuters v. Ross Intelligence 사건에서 델라웨어 연방지방법원이 공정이용 관련 상반된 판례를 내림에 따라 법적 불확실성은 여전히 존재하지만, 해당 판결들은 현재 계류 중인 다른 유사 소송들에 중요한 선례로 영향을 줄 것으로 보입니다.
2. 공정이용 원칙과 그 중요성
공정이용 원칙은 저작권법의 근본 목적인 창작 활동을 장려하기 위해 특정 조건 하에서 창작물에 대한 저작권자의 배타적 권리에 제한을 두는 법리입니다 (17 U.S.C. § 107). 미 법원은 공정이용 여부를 판단함에 있어 다음 네 가지 요소를 종합적으로 고려합니다:
① 저작물 이용 목적과 성격 – 비상업적 목적이거나, 원저작물을 단순히 대체하는 것을 넘어 새로운 목적이나 성격을 더하는 변형적(transformative) 이용일수록 공정이용으로 판단될 가능성이 높습니다.
② 저작물의 종류 및 용도 – 창작물이 사실에 기반하기 보다 창작성이 높은 표현 위주의 작품일수록 공정이용으로 인정되기 어렵습니다.
③ 이용된 부분이 저작물 전체에서 차지하는 비중과 그 중요성- 전체 작품 대비 이용된 부분이 차지하는 비중이 높거나 해당 내용의 중요성이 클 경우 공정이용으로 인정되기 어렵습니다.
④ 저작물의 이용이 저작물의 현재 또는 잠재적 시장 가치에 미치는 영향 – 창작물의 이용행위가 원저작물을 대체하거나 원저작물의 시장 가치에 심각한 타격을 입힐 경우 공정이용으로 인정되기 어렵습니다.
특히, 네 번째 요소인 저작물의 시장 가치에 미치는 영향은 공정이용 여부를 판단함에 있어 가장 중요한 요소로 여겨지며, Bartz v. Anthropic 사건과 Kadrey v. Meta 사건에서도 핵심 쟁점이었습니다.
3. 판례 분석
아래 각 사건에서 법원은 공정이용 원칙의 네 가지 요소를 종합적으로 고려하여 저작물의 이용이 공정이용에 해당하는지를 결정하였습니다.
① Thomson Reuters v. Ross Intelligence 사건 (2025년 2월 11일, 델라웨어 연방법원)
미국의 AI 기술 기반 법률 엔진 서비스 회사인 Ross Intelligence사가 검색 엔진 개발 및 학습을 위해 Thomson Reuters사가 보유한 또다른 법률 엔진 서비스인 Westlaw의 21,787개의 헤드노트 (법률 문서에서 관련 부분의 핵심 내용을 요약 및 설명하는 메모등을 의미함)를 무단 복제한 사건에서, 법원은 다음과 같은 이유로 저작물의 공정이용을 인정하지 않았습니다:
(1) 피고의 변형적 이용 주장 기각: 법원은 Ross Intelligence사의 서비스가 새로운 콘텐츠를 생성하는 생성형 AI가 아니라, 단순히 기존 법률 자료를 찾아주는 검색 서비스라고 판단하였습니다. 따라서, Westlaw와 실질적으로 동일한 목적의 서비스를 제공하는 것이므로 이는 변형적 이용이라 볼 수 없다고 결론지었습니다.
(2) 피고의 서비스가 시장에 미치는 부정적 영향 인정: 법원은Ross Intelligence의 법률 검색 엔진 서비스가 Westlaw의 서비스와 직접적으로 경쟁하여 법률 검색 엔진 시장에서 Thomson Reuters사에 실질적인 손실을 초래할 수 있다고 판단하였습니다.
② Bartz v. Anthropic 사건 (2025년 6월 23일, 캘리포니아 북부지방법원)
Anthropic사가 자사의 생성형 AI인 Claude의 개발 및 학습에 작가들의 저작물을 활용한 사실이 쟁점이 된 사건에서, 법원은 피고의 행위를 다음 세 가지 행위로 구분하여 검토한 후, 2번 및 3번에 해당하는 행위에 대해서만 공정이용을 인정했습니다:
(1) 해적 사이트를 통한 도서 수집 및 보관: 법원은 Anthropic이 Books3, LibGen, PiLiMi 등 해적 사이트에서 700만 권 이상의 도서를 영구 보관 목적으로 다운로드하여 라이브러리를 구축한 행위에 대해, 이는 유료 전자책 구독 서비스를 대체하려는 목적의 비변형적인 이용이며, 원작자의 시장 지위에 타격을 입히는 행위라고 판단하였습니다.
(2) 구매한 도서의 디지털 변환: 반면, 법원은 Anthropic사가 수백만 권의 인쇄본 도서를 스캔하여 디지털화한 행위에 대해서는, 원본과 다른 형식으로 변환한 점을 고려하여 변형적 이용이라고 판단하였습니다.
(3) AI 훈련을 위한 도서 이용: 합법적으로 취득한 도서들을 LLM 훈련 데이터셋에 포함시킨 행위에 대해, Claude가 원저작물과 본질적으로 다른 결과물을 생성한다는 점을 고려하여 이를 변형적 이용으로 인정하였습니다.
③ Kadrey v. Meta 사건 (2025년 6월 25일, 캘리포니아 북부지방법원)
13인의 저명한 소설가들이 Meta가 Llama 언어모델 훈련을 위해 LibGen과 같은 공유 플랫폼에서 자신들의 저작물을 불법적으로 다운로드하여 사용했다고 주장한 사건에서, 법원은 다음과 같은 근거로 Meta의 공정이용을 인정하였습니다:
(1) 저작물의 변형적 이용: 법원은 Meta가 원저작물을 그대로 재생산하지 않고, LLM의 다양한 기능(이메일 작성, 번역, 코드 생성 등)을 위한 학습 목적으로 활용했다는 점에 주목하며, 이러한 이용이 본질적으로 변형적이라고 판단했습니다.
(2) 저작물의 시장 가치에 대한 영향: 무엇보다 법원은 원고 측이 제시한 증거만으로는 Llama가 원저작물의 시장 가치를 침해했다는 주장을 뒷받침하기에 불충분하다고 판단하였습니다. 특히, Llama가 적대적 프롬프팅(adversarial prompting)을 통해서도 원저작물을 비교 가능한 의미 있는 수준으로 재생산할 수 없었으며, 작가들이 AI 생성물이 원저작물의 판매량에 악영향을 미쳤다는 구체적인 증거를 제시하지 못하였다는 점을 고려하였습니다.
4. 시사점
이상 살펴본 사건들은 생성형 AI의 저작물 학습에 대한 공정이용 여부를 판단함에 있어 다음과 같은 시사점을 제시합니다.
첫째, AI 기술의 학습 데이터를 적법한 방법으로 수집하였는지 여부가 저작물의 공정이용 판단에 중요한 고려요소가 될 수 있습니다. 즉, 합법적으로 구매한 저작물을 AI 훈련에 활용할 경우 변형적 이용으로 인정받을 가능성이 높으나, 불법 사이트 등을 통해 취득한 저작물을 AI 훈련에 사용할 경우 이러한 행위가 공정이용으로 인정되기는 어려울 것으로 보입니다.
둘째, 생성형 AI가 저작물의 시장가치에 미치는 영향을 주장하기 위해서는 AI 기술로 인한 저작물의 실질적인 판매량 감소나 경제적 손실 등 구체적인 입증자료를 제시해야 합니다. 단순히 AI 기술이 저작물과 유사한 콘텐츠를 생성할 수 있다는 등의 주장만으로는 AI 기술의 저작권 침해 여부를 입증하는데 한계가 있을 수 있습니다.
셋째, AI 기술이 원저작물과 본질적으로 다른 기능과 목적을 수행한다는 점에서 AI 기술을 이용한 저작물의 변형적 이용이 인정될 가능성이 높아졌습니다.
미국 판례가 국내에서 직접적인 구속력을 갖지는 않으나, 향후 국내 법원이 유사한 분쟁을 다룰 경우 검토 차원에서 이러한 해외 판례를 참고할 가능성이 높습니다. 다만 미국의 fair use와 한국 저작권법의 공정이용 범위가 다르다는 점은 감안되어야 할 것입니다. 생성형 AI 기술을 개발 중인 국내 기업들은 현재 미국에서 계류 중인 저작권 사건들의 동향을 지속적으로 모니터링하고, 이를 통해 저작권 침해 소송 리스크에 선제적으로 대비하는 것이 바람직할 것입니다.
화우 AI센터는 AI와 관련한 지식재산, 개인정보, 정보보안, 공정거래, 제조물책임, 입법컨설팅, 쟁송 등 모든 법적 영역에서 축적된 경험과 노하우를 기반으로 기업 고객을 위한 최적의 솔루션을 안내해드리고 있습니다. AI와 관련하여 문의사항이 있으신 경우 언제든지 화우에 연락하여 주시기 바랍니다.
- 관련 분야
- #AI센터