Kiểm tra bảo mật của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, đánh giá mới nhất đã bác bỏ lý do của Anthropic cho rằng nó quá nguy hiểm để công khai.

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1413 từ

Các đánh giá mới nhất từ Viện An toàn AI Vương quốc Anh (AISI) cho thấy GPT-5.5 của OpenAI, vốn đã được phát hành công khai, có khả năng bảo mật ngang ngửa với Mythos Preview của Anthropic – mô hình vốn bị hạn chế quyền truy cập vì lý do "quá nguy hiểm". (Tóm tắt trước đó: Mô hình mới Mythos của Anthropic mạnh đến mức chính công ty cũng không dám phát hành: có thể tự mình tấn công Linux toàn cầu và tạo ra chuỗi lỗ hổng hoàn chỉnh chỉ trong vài giờ) (Bối cảnh bổ sung: Coinbase, Binance tìm cách tích hợp mô hình Claude Mythos để tăng cường an ninh mạng, liệu AI mạnh nhất có thể chấm dứt nạn hack tiền điện tử?) Mythos Preview có rủi ro quá cao nên chỉ được mở quyền truy cập cho các "đối tác ngành trọng yếu", với lý do là nó đã vượt qua ngưỡng nguy hiểm về khả năng tấn công mạng, nhưng lập luận này dường như bắt đầu lung lay trong tuần này. Đầu tháng, báo cáo đánh giá mới nhất của AISI về GPT-5.5 cho thấy GPT-5.5, vốn đã được OpenAI mở rộng cho người dùng trả phí vào tuần trước, đạt kết quả gần như ngang bằng với Mythos Preview trong cùng một khung kiểm tra an ninh (trong khi GPT-5.5 là mô hình mà bất kỳ ai có tài khoản đều có thể sử dụng). Kể từ năm 2023, AISI đã thực hiện đánh giá khả năng an ninh tiêu chuẩn hóa cho các mô hình AI tiên tiến. Khung kiểm tra bao gồm 95 thử thách "Capture The Flag", bao gồm 5 loại hình chính như kỹ thuật đảo ngược, tấn công thâm nhập trang web, mật mã học, v.v. Đối với các nhiệm vụ cấp độ Expert khó nhất, tỷ lệ vượt qua trung bình của GPT-5.5 là 71,4%, trong khi Mythos Preview là 68,6%. Khoảng cách giữa hai mô hình nằm trong phạm vi sai số thống kê và không tạo ra sự khác biệt đáng kể. Trong một câu hỏi khó yêu cầu mô hình tự viết trình dịch ngược (khôi phục tệp nhị phân đã biên dịch bằng Rust thành mã có thể phân tích), hồ sơ của AISI cho thấy GPT-5.5 đã giải quyết vấn đề mà không cần sự can thiệp của con người trong 10 phút 22 giây với chi phí API là 1,73 USD. Đáng chú ý hơn là bài kiểm tra "The Last Ones" (TLO), đây là mạng lưới doanh nghiệp mô phỏng do AISI thiết lập, được thiết kế như một chuỗi tấn công đánh cắp dữ liệu hoàn chỉnh gồm 32 bước, yêu cầu AI tự động phát hiện, thâm nhập, di chuyển ngang và cuối cùng lấy dữ liệu mục tiêu, mô phỏng toàn bộ hành vi của hacker thực thụ. Trước đó, chưa có mô hình AI nào thành công dù chỉ một lần trên TLO. Lần này, GPT-5.5 đã thành công 3 trong 10 lần thử, Mythos Preview thành công 2 lần, cả hai cùng trở thành nhóm mô hình đầu tiên trong lịch sử đạt điểm trong bài kiểm tra này. Đáng chú ý là cả hai mô hình đều thất bại trong bài kiểm tra "Cooling Tower" khó hơn. Bài kiểm tra này mô phỏng các cuộc tấn công phá hoại phần mềm nhắm vào hệ thống điều khiển nhà máy điện, cho thấy AI hiện vẫn chưa thể tự mình thực hiện các cuộc tấn công mạng ở cấp độ cơ sở hạ tầng trọng yếu. Lập luận của Anthropic về việc hạn chế quyền truy cập Mythos là: công ty định vị nó như một "tài sản phòng thủ chiến lược", chỉ mở cho các cơ quan chính phủ đáng tin cậy và một số ít đối tác. Từ góc độ phòng thủ, logic này có vẻ hợp lý: kiểm soát AI an ninh mạnh nhất trong môi trường được giám sát để ngăn chặn việc bị lạm dụng. Tuy nhiên, dữ liệu của AISI đã xé toạc lỗ hổng trong logic này. Nếu GPT-5.5 tương đương với Mythos Preview ở hầu hết các chỉ số quan trọng, trong khi GPT-5.5 đã mở cho bất kỳ người dùng trả phí nào, thì rốt cuộc Anthropic đang ngăn chặn điều gì? Trên SWE-bench Pro (bài kiểm tra tiêu chuẩn đánh giá khả năng sửa lỗi phần mềm thực tế của AI), Mythos Preview thực sự dẫn trước với 64,3% so với 58,6% của GPT-5.5, cho thấy vẫn còn khoảng cách trong một số kịch bản kỹ thuật an ninh. Nhưng điều này không đủ để củng cố câu chuyện "

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-03

Kết quả kiểm tra an ninh của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, bác bỏ lý do của Anthropic rằng nó quá nguy hiểm để công khai.

Độ tương đồng 420%關鍵字 anthropic/資安測試與/claude同分類 zh

2026-04-23

CEO OpenAI Sam Altman chỉ trích Anthropic: Tiếp thị nỗi sợ hãi Claude Mythos chỉ để độc quyền AI

Độ tương đồng 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-04-22

Bloomberg tiết lộ Claude Mythos đã bị truy cập trái phép! Lỗ hổng khó phòng thủ nhất của Anthropic luôn là "con người"

Độ tương đồng 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-05-28