Anthropic quét 2 triệu cuốn sách để huấn luyện Claude xong, đưa thẳng vào máy hủy giấy tiêu hủy

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯2169 từ

Vụ kiện phát sinh từ việc Anthropic bí mật mua 2 triệu cuốn sách, cắt gáy, quét rồi đưa đi máy hủy giấy đã đón phiên điều trần cuối cùng vào tuần trước. Nhưng dư luận đã tiêu hóa xong, không có luật mới nào được ban hành, không có quy chuẩn ngành nào được lập, không có công ty thứ hai nào bị nêu tên. (Tóm tắt trước đó: Anthropic lén dùng 7 triệu cuốn sách để huấn luyện Claude, đối mặt với vụ kiện vi phạm bản quyền cấp nghìn tỷ! Cuộc chạy đua điên cuồng và ranh giới pháp lý của gã khổng lồ AI) (Bổ sung bối cảnh: Musk kiện OpenAI thua kiện! Yêu cầu bồi thường 134 tỷ USD bất thành, rào cản pháp lý lớn nhất cho IPO mà Altman thúc đẩy đã được gỡ bỏ) Ngày 14 tháng 5 năm 2026, phiên điều trần cuối cùng của vụ Bartz v. Anthropic được tổ chức tại San Francisco. Điểm khởi đầu của vụ kiện này là kế hoạch "Project Panama" – Anthropic bí mật mua 2 triệu cuốn sách, cắt gáy quét rồi tiêu hủy bản gốc. Vụ kiện đã được dàn xếp với mức 1,5 tỷ USD vào tháng 9 năm 2025, và tuần trước chính thức đi đến hồi kết. Nhưng vụ kiện đã kết thúc, còn những vấn đề mà nó phơi bày thì chưa. Bên khởi kiện: Andrea Bartz (tiểu thuyết gia kinh dị), Charles Graeber, Kirk Wallace Johnson (nhà văn phi hư cấu) – ba người đại diện cho khoảng 500.000 tác giả khởi kiện tập thể, đệ đơn lên Tòa án Liên bang Khu vực Bắc California vào năm 2024. Thẩm phán chủ tọa: William Alsup. Kết quả phán quyết: - Tháng 6 năm 2025: Thẩm phán Alsup phán quyết rằng sách được mua hợp pháp dùng để huấn luyện AI thuộc diện sử dụng hợp lý; nhưng sách lậu tải xuống thông qua các thư viện bóng tối như LibGen không được bảo hộ theo nguyên tắc sử dụng hợp lý - Ngày 5 tháng 9 năm 2025: Anthropic đạt thỏa thuận dàn xếp với nguyên đơn, chi trả 1,5 tỷ USD (vụ dàn xếp bản quyền lớn nhất trong lịch sử Hoa Kỳ), khoảng 3.000 USD cho mỗi cuốn sách - Ngày 25 tháng 9 năm 2025: Thẩm phán Alsup phê duyệt sơ bộ thỏa thuận dàn xếp - Ngày 14 tháng 5 năm 2026: Phiên điều trần phê duyệt cuối cùng Trong các tài liệu được giải mật đầu năm nay, có một bản kế hoạch nội bộ của Anthropic viết như sau: "Project Panama là kế hoạch của chúng tôi nhằm quét hủy toàn bộ sách trên thế giới." Bên cạnh ghi chú còn có câu: "Chúng tôi không muốn bên ngoài biết chúng tôi đang làm việc này." Khi đó, Anthropic đã ủy thác cho một nhà cung cấp dịch vụ quét tài liệu chuyên nghiệp xử lý từ 500.000 đến 2 triệu cuốn sách trong khoảng sáu tháng. Quy trình gồm ba bước: - Máy cắt sách thủy lực cắt phẳng gáy sách - Máy quét cấp sản xuất tốc độ cao quét từng trang thành tệp số - Cuối cùng do công ty tái chế định kỳ thu gom rác giấy Nguồn sách đến từ The Strand, hiệu sách cũ có lịch sử gần một trăm năm ở New York này nằm trong danh sách thu mua, các nền tảng sách cũ trực tuyến và thư viện cũng đều là nguồn cung. Số sách mua vào không phải là cổ tịch quý hiếm, mà là sách cũ thông thường đã có người đọc, có thể bán lại, được mua theo lô với quy mô hàng trăm nghìn cuốn. Logic pháp lý của Anthropic rất rõ ràng: "Nguyên tắc bán lần đầu" cho phép bên mua xử lý tùy ý sách thực thể được mua hợp pháp; việc tiêu hủy bản gốc có thể ngăn chặn lưu thông bất hợp pháp lần nữa, củng cố thêm lập luận về "sử dụng có tính chuyển hóa". Thẩm phán cuối cùng đã công nhận hành vi này phù hợp với nguyên tắc sử dụng hợp lý. Nhưng số lượng lớn sách lậu được sử dụng cùng thời kỳ thì không có lớp bảo vệ này, cuối cùng được dàn xếp với mức khoảng 1,5 tỷ USD, quy đổi ra mỗi cuốn sách được bồi thường khoảng 3.000 USD. Anthropic cũng biết chuyện này nói ra không hay ho gì, nên trong tài liệu nội bộ không chỉ một lần xuất hiện cụm từ "không muốn công chúng biết". Sự kín tiếng có chủ ý này tương phản trực tiếp với những luận điệu cao giọng của công ty này về vấn đề an toàn AI trong thời gian dài. Hình ảnh công khai của Anthropic được xây dựng trên nền tảng "phát triển AI có trách nhiệm"; nhưng kế hoạch cắt sách bí mật này lại không phù hợp với hình ảnh đó. Thực ra vào năm 2004, Google đã công khai tuyên bố hợp tác với các thư viện nghiên cứu hàng đầu như Harvard, Stanford, Oxford để khởi động kế hoạch "Google Books". Google cũng đã quét hàng chục triệu cuốn sách, cũng đối mặt với vụ kiện bản quyền (Hiệp hội Tác giả kiện Google), và năm 2015 cũng được tòa án phán quyết là sử dụng hợp lý. Nhưng Google đã làm hai việc mà Anthropic không làm, khiến cảm nhận của cộng đồng hoàn toàn khác biệt. Thứ nhất, sách sau khi Google quét đều được giữ lại trong thư viện: bản gốc được lưu trữ nguyên vẹn, thư viện còn có được bản sao kỹ thuật số, công chúng có thêm kênh để truy cập những cuốn sách này. Thứ hai, mục đích là để sách được tìm thấy: chỉ mục tìm kiếm, xem trước đoạn trích, giúp độc giả khám phá những tác phẩm mà họ vốn không biết là tồn tại. Bên hưởng lợi là tất cả những người sử dụng công cụ tìm kiếm. Kế hoạch được công khai, các nhà xuất bản có thể chọn rút lui. Anthropic làm một việc khác: nội dung sách đi vào lớp tham số của mô hình tư nhân, trở thành năng lực cạnh tranh cốt lõi của sản phẩm AI thương mại. Bản gốc bị tiêu hủy, độc giả sau này không thể tìm được cuốn sách đó, tác giả nhận khoảng 3.000 USD tiền dàn xếp, bên hưởng lợi là cổ đông và định giá của Anthropic. Đồng thời kế hoạch được giữ bí mật, không có bất kỳ cơ chế rút lui nào. Trong cả hai vụ việc, thẩm phán cuối cùng đều phán quyết là sử dụng hợp lý. Nhưng khái niệm "sử dụng có tính chuyển hóa", trong ngữ cảnh của Google là biến một cuốn sách thành một cổng vào có thể được tìm thấy; trong ngữ cảnh của Anthropic, là tiêu hóa một cuốn sách vào AI tư nhân, rồi để bản gốc biến mất. Lý do con người lưu trữ tri thức bằng văn bản là để người tiếp theo có thể đọc được. Thư viện, thị trường sách cũ, lưu thông công cộng sau khi bản quyền hết hạn, đằng sau đều là cùng một giả định: tri thức nên có thể được truyền lại, được truy cập lại. Nhưng Project Panama của Claude đã cắt đứt mắt xích này: nội dung sách đi vào mô hình tư nhân của Anthropic, bản gốc biến mất, tác giả nhận tiền dàn xếp, độc giả sau này mất đi một cuốn sách có thể tìm thấy. Và khó giải quyết hơn cả bồi thường bản quyền là hiện nay căn bản chưa có bất kỳ cơ chế nào để quyết định "tri thức nào đáng được huấn luyện vào mô hình" có thể được thảo luận công khai, bị chất vấn, được điều chỉnh. Việc lựa chọn dữ liệu huấn luyện là một quyết định ở thượng nguồn nhất của AI, nhưng lại gần như là khâu ít được đề cập nhất trong các cuộc thảo luận về quản lý. Project Panama là trường hợp đầu tiên được giải mật. Nhưng đây không phải là trường hợp đơn lẻ, chỉ là đa số các trường hợp vẫn chưa có một vụ kiện bản quyền nào giúp nó thoát khỏi bóng tối của thỏa thuận bảo mật. Ranh giới của sử dụng hợp lý trong tương lai, trong thời đại AI cần nhiều thảo luận hơn.

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-20

Phân tích sâu phía sau cơn bão khóa tài khoản của Anthropic: Tôn giáo an toàn, nội chiến AI và thế khó của Claude dưới sự tách rời Mỹ-Trung

Độ tương đồng 170%關鍵字 anthropic/claude同分類 zh

2026-05-20

Claude Managed Agents mở sandbox tự lưu trữ và kênh mã hóa MCP, Anthropic muốn đưa môi trường thực thi vào mạng nội bộ doanh nghiệp

Độ tương đồng 170%關鍵字 anthropic/claude同分類 zh

2026-05-14

Anthropic ra mắt "Claude for Small Business": Nhắm vào tự động hóa công việc AI cho doanh nghiệp vừa và nhỏ, giúp bạn đòi hóa đơn, tính lương..

Độ tương đồng 170%關鍵字 anthropic/claude同分類 zh

2026-05-14