ニュース一覧Anthropicは200万冊の書籍をスキャンしてClaudeを訓練した後、直接シュレッダーに送って廃棄
動區 BlockTempo2026-05-19 08:38:32

Anthropicは200万冊の書籍をスキャンしてClaudeを訓練した後、直接シュレッダーに送って廃棄

ORIGINALAnthropic 掃描 200 萬本書籍訓練 Claude 後,直接送入碎紙機銷毀
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯2169 文字
Anthropicが密かに200万冊の書籍を購入し、背を裁断、スキャンしてシュレッダーに送ったことから派生した訴訟事件は、先週最終公聴会を迎えた。しかし世論は消化し終え、新たな立法もなく、業界規範もなく、第二の企業が名指しされることもなかった。 (前回のあらすじ:AnthropicがClaude訓練のため700万冊の書籍を不正使用、兆ドル級の海賊版訴訟に直面!AI巨頭の暴走と法的境界) (背景補足:マスクがOpenAIを提訴するも敗訴!1,340億ドルの賠償請求は実らず、AltmanのIPO最大の法的障害が解除) 2026年5月14日、Bartz v. Anthropicの最終公聴会がサンフランシスコで開催された。この訴訟の発端は、Anthropicが密かに200万冊の書籍を購入し、背を裁断してスキャンした後、原本を廃棄した「Project Panama」計画である。本訴訟は2025年9月に15億ドルで和解し、先週正式に終結を迎えた。 しかし訴訟は終わったが、それが明らかにした問題は終わっていない。 原告:Andrea Bartz(スリラー小説家)、Charles Graeber、Kirk Wallace Johnson(ノンフィクション作家)の3名が、約50万人の著者を代表して集団訴訟を提起し、2024年にカリフォルニア北部地区連邦地方裁判所に申し立てた。主任裁判官:William Alsup。 判決結果: - 2025年6月:Alsup判事は、合法的に購入された書籍をAI訓練に使用することはフェアユースに該当すると判断;しかしLibGenなどシャドウライブラリからダウンロードされた海賊版書籍はフェアユースの保護を受けない - 2025年9月5日:Anthropicは原告と和解に達し、15億ドル(米国史上最大の著作権和解事件)を支払い、1冊あたり約3,000ドル - 2025年9月25日:Alsup判事が和解を仮承認 - 2026年5月14日:最終承認公聴会 年初に開示された資料の中に、Anthropicの内部計画書にはこう書かれていた:「Project Panamaは、世界中のすべての書籍に対して破壊的スキャンを行う我々の計画である。」傍らの備考欄にはこう記されていた:「我々はこれを行っていることを外部に知られたくない。」 当時、Anthropicは専門のアーカイブスキャン業者に委託し、約6か月間で50万冊から200万冊の書籍を処理した。プロセスは3つのステップ: - 油圧式書籍裁断機で書籍の背を整然と切除 - 高速生産級スキャナーでページごとにデジタルファイルへスキャン - 最後にリサイクル会社が定期的に紙くずを回収 書籍の入手元は古書商The Strand、ニューヨークで100年近い歴史を持つこの古本屋が調達リストに入っており、オンライン古書プラットフォームや図書館も入手元の一つだった。購入されたのは希少な古書ではなく、誰かが読んだことのある転売可能な普通の古書で、数十万冊単位でまとめ買いされた。 Anthropicの法的論理は明確だ:「ファーストセール原則」により、買主は合法的に購入した実体書籍に対していかなる処分も可能;原本を廃棄することで違法な再流通を防ぎ、さらに「変容的使用」の主張を強化する。裁判官は最終的にこの行為がフェアユースに該当すると認定した。 しかし同時期に使用された大量の海賊版書籍はこの保護を受けられず、最終的に約15億ドルで和解、換算すると1冊あたりの賠償額は約3,000ドルとなった。 Anthropicもこのことが公になれば外聞が悪いと分かっていたため、内部資料には「公衆に知られたくない」という文言が一度ならず登場した。 このような意図的な低姿勢は、同社が長年AI安全問題で展開してきた高姿勢な論述と直接対照をなす。Anthropicの公開イメージは「責任あるAI開発」の上に築かれているが、この秘密の書籍裁断計画は、このイメージと一致しない。 実は2004年、Googleはハーバード、スタンフォード、オックスフォードなどトップ研究図書館との協力を公に発表し、「Google Books」計画を始動させた。Googleも同様に数千万冊の書籍をスキャンし、同様に著作権訴訟(作家協会対Google)に直面し、2015年に同様に裁判所からフェアユースと判定された。 しかしGoogleはAnthropicがやらなかった2つのことを行い、コミュニティの印象は全く異なっていた。 第一に、Googleがスキャンした書籍はすべて図書館に残された:原本は完全に保管され、図書館はさらにデジタルバックアップを獲得し、公衆はこれらの書籍にアクセスする手段が増えた。 第二に、目的は書籍を見つけられるようにすることだった:検索索引、断片プレビューで、読者が本来存在を知らなかった作品を発見する手助けをする。受益者は検索エンジンを使うすべての人々だった。計画は公開され、出版社はオプトアウトを選択できた。 Anthropicがやったのは別のことだ:書籍の内容は私有モデルのパラメータ層に入り込み、商用AI製品の中核的競争力となった。原本は廃棄され、後の読者はその書籍を見つけることができず、著者は約3,000ドルの和解金を受け取り、受益者はAnthropicの株主と評価額となった。 同時に計画は秘密であり、いかなるオプトアウトメカニズムもなかった。 2つの事例とも最終的に裁判官はフェアユースと判決した。しかし「変容的使用」というこの概念は、Googleの文脈では1冊の書籍を見つけられる入口に変えることであり、Anthropicの文脈では、1冊の書籍を私有AIに消化させ、その後原本を消失させることである。 人類が書面知識を保存する理由は、次の人が読めるようにするためである。図書館、古書市場、著作権満了後の公共流通、その背後にはすべて同じ前提がある:知識は伝達され、再びアクセスされるべきだ。 しかしClaudeのProject Panamaはこの連鎖を断ち切った:書籍の内容はAnthropicの私有モデルに入り、原本は消失し、著者は和解金を受け取り、後の読者は見つけられる書籍が一冊減った。 そして著作権賠償よりも解決が難しいのは、現時点で「どの知識がモデルに訓練される価値があるか」という決定を、公開で議論し、疑問を呈し、調整できるメカニズムが全く存在しないことだ。訓練データの選択はAIの最も上流にある決定の一つだが、規制議論の中でほとんど触れられない部分である。 Project Panamaは最初に開示された事例である。しかしこれは孤立した例ではなく、ただ大多数の事例はまだ著作権訴訟によって守秘義務契約の影から引き出されていないだけだ。 今後のフェアユースの境界は、AI時代においてより多くの議論が必要である。
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:290d947f2b
ソース:動區 BlockTempo
公開:2026-05-19 08:38:32
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント