뉴스 목록Anthropic가 Claude 학습을 위해 200만 권의 책을 스캔한 후, 곧바로 파쇄기로 보내 폐기
動區 BlockTempo2026-05-19 08:38:32

Anthropic가 Claude 학습을 위해 200만 권의 책을 스캔한 후, 곧바로 파쇄기로 보내 폐기

ORIGINALAnthropic 掃描 200 萬本書籍訓練 Claude 後,直接送入碎紙機銷毀
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯2169 자
Anthropic이 비밀리에 200만 권의 책을 구매하고, 책등을 자르고, 스캔한 뒤 파쇄기로 보낸 일에서 비롯된 소송이 지난주 최종 심리를 맞이했다. 그러나 여론이 소화되고 나니, 새로운 입법도 없고, 산업 규범도 없고, 두 번째로 지목된 회사도 없었다. (전편 요약: Anthropic이 700만 권의 책을 몰래 사용해 Claude를 훈련시켜, 조 단위의 해적판 소송에 직면! AI 거물의 폭주와 법적 경계) (배경 보충: Musk가 OpenAI를 고소했으나 패소! 1,340억 달러 배상 청구 무산, Altman의 IPO 추진 최대 법적 장애물 해소) 2026년 5월 14일, Bartz v. Anthropic 최종 심리가 San Francisco에서 열렸다. 이 소송의 출발점은 Anthropic이 비밀리에 200만 권의 책을 구매한 뒤 책등을 잘라 스캔하고 원본을 폐기한 「Project Panama」 계획이다. 이 소송은 2025년 9월에 15억 달러로 화해가 성립되었고, 지난주 공식적으로 마무리 단계에 들어섰다. 그러나 소송은 끝났지만, 그것이 드러낸 문제들은 끝나지 않았다. 원고: Andrea Bartz(스릴러 소설가), Charles Graeber, Kirk Wallace Johnson(논픽션 작가) 세 사람이 약 50만 명의 작가를 대표하여 집단소송을 제기했으며, 2024년 California 북부 연방지방법원에 제출되었다. 주심 판사: William Alsup. 판결 결과: - 2025년 6월: Alsup 판사는 합법적으로 구매한 책을 AI 훈련에 사용하는 것은 공정 이용(fair use)에 해당한다고 판결했지만, LibGen 등 섀도우 라이브러리를 통해 다운로드한 해적판 책은 공정 이용 보호를 받지 못한다고 판결했다. - 2025년 9월 5일: Anthropic이 원고와 화해에 도달하여 15억 달러를 지급(미국 역사상 최대 저작권 화해 사건)했으며, 책 한 권당 약 3,000달러에 해당한다. - 2025년 9월 25일: Alsup 판사가 화해를 예비 승인했다. - 2026년 5월 14일: 최종 승인 심리. 연초에 공개된 문서에는 다음과 같은 Anthropic 내부 계획서가 있었다: 「Project Panama는 전 세계 모든 책에 대해 파괴적 스캔을 수행하는 우리의 계획이다.」 옆 비고란에는 또 한 문장이 있었다: 「우리는 외부에서 우리가 이 일을 하고 있다는 것을 알기를 원치 않는다.」 당시 Anthropic은 전문 아카이브 스캔 업체에 위탁하여 약 6개월 만에 50만에서 200만 권의 책을 처리했다. 프로세스는 세 단계로 이루어졌다: - 유압식 책 절단기로 책등을 가지런히 잘라낸다 - 고속 생산급 스캐너로 페이지마다 디지털 파일로 스캔한다 - 마지막으로 재활용 업체가 정기적으로 종이 폐기물을 수거해 간다 책의 출처는 중고 서점 The Strand로, New York에서 거의 100년의 역사를 가진 이 헌책방이 구매 목록에 있었으며, 온라인 중고 플랫폼과 도서관도 모두 출처 중 하나였다. 구매한 것은 희귀 고서가 아니라, 누군가 읽었고 재판매가 가능한 평범한 헌책들이었으며, 수십만 권 규모의 일괄 구매였다. Anthropic의 법률 논리는 명확했다: 「최초 판매의 원칙(first sale doctrine)」은 매수자가 합법적으로 구매한 실물 책에 대해 어떤 처분도 할 수 있도록 허용한다; 원본을 폐기하는 것은 불법 재유통을 방지할 수 있으며, 「전환적 사용(transformative use)」 주장을 더욱 강화한다. 판사는 최종적으로 이 행위가 공정 이용에 부합한다고 판단했다. 그러나 같은 시기에 사용된 대량의 해적판 책에는 이러한 보호가 없었으며, 결국 약 15억 달러로 화해했고, 환산하면 책 한 권당 배상금이 약 3,000달러였다. Anthropic도 이 일이 공개되면 보기 좋지 않다는 것을 알고 있었기에, 내부 문서에 「공중에게 알리고 싶지 않다」는 문구가 한 번 이상 등장했다. 이러한 의도적인 저자세는, 이 회사가 오랫동안 AI 안전 문제에 대해 고자세로 펼쳐온 담론과 직접적인 대비를 이룬다. Anthropic의 공개 이미지는 「책임감 있는 AI 개발」 위에 세워져 있다; 그러나 이 비밀 책 절단 계획은 이 이미지와 부합하지 않는다. 사실 2004년, Google은 Harvard, Stanford, Oxford 등 최고 연구 도서관과 협력하여 「Google Books」 계획을 시작한다고 공개 발표했다. Google도 마찬가지로 수천만 권의 책을 스캔했고, 마찬가지로 저작권 소송(작가협회 대 Google)에 직면했으며, 2015년에 마찬가지로 법원으로부터 공정 이용 판결을 받았다. 그러나 Google은 Anthropic이 하지 않은 두 가지를 했고, 커뮤니티의 시선은 완전히 달랐다. 첫째, Google이 스캔한 책들은 모두 도서관에 남았다: 원본은 온전히 보존되었고, 도서관은 디지털 백업도 얻었으며, 대중은 이 책들에 접근할 수 있는 채널이 늘어났다. 둘째, 목적은 책이 발견되도록 하는 것이었다: 검색 인덱스, 부분 미리보기를 통해 독자가 원래 존재하는지도 몰랐던 작품을 발견하도록 돕는다. 수혜자는 검색 엔진을 사용하는 모든 사람이다. 계획은 공개적이었으며, 출판사는 옵트아웃을 선택할 수 있었다. Anthropic이 한 것은 다른 일이다: 책의 내용은 사적 모델의 파라미터 층으로 들어가, 상업적 AI 제품의 핵심 경쟁력이 되었다. 원본은 폐기되었고, 후세의 독자는 그 책을 찾을 수 없게 되었으며, 작가는 약 3,000달러의 화해금을 받았고, 수혜자는 Anthropic의 주주와 기업 가치다. 동시에 계획은 비밀이었고, 어떠한 옵트아웃 메커니즘도 없었다. 두 사례 모두 최종적으로 판사는 공정 이용으로 판결했다. 그러나 「전환적 사용」이라는 개념은, Google의 맥락에서는 한 권의 책을 발견될 수 있는 입구로 만드는 것이지만; Anthropic의 맥락에서는 한 권의 책을 사적 AI로 소화시키고, 그런 다음 원본을 사라지게 하는 것이다. 인류가 서면 지식을 저장하는 이유는, 다음 사람이 읽을 수 있도록 하기 위해서다. 도서관, 중고 서적 시장, 저작권 만료 후의 공공 유통, 그 배후에는 모두 같은 가정이 있다: 지식은 전달되고, 다시 접근될 수 있어야 한다. 그러나 Claude의 Project Panama는 이 사슬을 끊었다: 책의 내용은 Anthropic의 사적 모델로 들어갔고, 원본은 사라졌으며, 작가는 화해금을 받았고, 후세의 독자는 찾을 수 있는 책 한 권을 잃었다. 그리고 저작권 배상보다 해결하기 더 어려운 것은, 현재 「어떤 지식이 모델에 훈련될 가치가 있는가」라는 결정이 공개적으로 논의되고, 의문이 제기되고, 조정될 수 있도록 하는 어떠한 메커니즘도 전혀 없다는 점이다. 훈련 데이터의 선택은 AI의 가장 상류에 있는 결정이지만, 규제 논의에서 거의 가장 적게 다루어지는 부분이다. Project Panama는 처음으로 공개된 사례다. 그러나 이것은 고립된 사례가 아니며, 단지 대부분의 사례는 아직 그것을 기밀 유지 협약의 그늘에서 끌어낼 저작권 소송 한 건이 없을 뿐이다. 앞으로 공정 이용의 경계는, AI 시대에 더 많은 논의가 필요하다.
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:290d947f2b
출처:動區 BlockTempo
발행:2026-05-19 08:38:32
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글