Kết quả kiểm tra an ninh của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, bác bỏ lý do của Anthropic rằng nó quá nguy hiểm để công khai.

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1413 từ

Đánh giá mới nhất từ Viện An toàn AI Vương quốc Anh (AISI) cho thấy GPT-5.5 của OpenAI, vốn đã được phát hành công khai, có khả năng an ninh mạng gần như ngang ngửa với Mythos Preview của Anthropic – mô hình vốn bị hạn chế quyền truy cập vì lý do "quá nguy hiểm". (Tóm tắt trước đó: Mô hình mới Mythos của Anthropic mạnh đến mức chính công ty cũng không dám phát hành: có thể tự mình tấn công Linux toàn cầu và tạo ra chuỗi lỗ hổng hoàn chỉnh chỉ trong vài giờ) (Bối cảnh bổ sung: Coinbase, Binance tìm cách tích hợp mô hình Claude Mythos để tăng cường an ninh, liệu AI mạnh nhất có thể chấm dứt nạn hack tiền mã hóa?) Mythos Preview có rủi ro quá cao nên chỉ được mở quyền truy cập cho các "đối tác ngành trọng yếu", với lý do là nó đã vượt qua một ngưỡng nguy hiểm về khả năng tấn công mạng, nhưng lập luận này dường như bắt đầu lung lay trong tuần này. Đầu tháng, báo cáo đánh giá mới nhất của AISI về GPT-5.5 cho thấy GPT-5.5, vốn đã được OpenAI mở rộng cho tất cả người dùng trả phí vào tuần trước, đạt kết quả gần như ngang bằng với Mythos Preview trong cùng một khung kiểm tra an ninh (trong khi GPT-5.5 là mô hình mà bất kỳ ai có tài khoản đều có thể sử dụng). Kể từ năm 2023, AISI đã thực hiện đánh giá năng lực an ninh mạng tiêu chuẩn hóa cho các mô hình AI tiên tiến, khung kiểm tra bao gồm 95 thử thách "Capture The Flag", bao gồm 5 loại hình như kỹ thuật đảo ngược, tấn công thâm nhập trang web, mật mã học, v.v. Đối với các nhiệm vụ cấp độ Expert khó nhất, tỷ lệ vượt qua trung bình của GPT-5.5 là 71.4%, Mythos Preview là 68.6%, khoảng cách giữa hai bên nằm trong phạm vi sai số thống kê và không tạo ra sự khác biệt đáng kể. Trong một câu hỏi khó yêu cầu mô hình tự viết trình dịch ngược (khôi phục tệp nhị phân đã biên dịch bằng Rust thành mã có thể phân tích), hồ sơ của AISI cho thấy GPT-5.5 đã giải quyết xong trong 10 phút 22 giây với chi phí API là 1.73 USD mà không cần bất kỳ sự can thiệp nào của con người. Có ý nghĩa chỉ dấu hơn là bài kiểm tra "The Last Ones" (TLO), đây là mạng lưới doanh nghiệp mô phỏng do AISI thiết lập, được thiết kế thành một chuỗi tấn công đánh cắp dữ liệu hoàn chỉnh gồm 32 bước, yêu cầu AI tự động phát hiện, thâm nhập, di chuyển ngang và cuối cùng lấy dữ liệu mục tiêu, mô phỏng toàn bộ hành vi của hacker thực thụ. Trước đó, chưa có mô hình AI nào thành công dù chỉ một lần trên TLO. Lần này, GPT-5.5 thành công 3 trong 10 lần thử, Mythos Preview thành công 2 lần, cả hai cùng trở thành nhóm mô hình đầu tiên trong lịch sử đạt điểm trong bài kiểm tra này. Đáng chú ý là cả hai mô hình đều thất bại hoàn toàn trong bài kiểm tra "Cooling Tower" có độ khó cao hơn. Bài kiểm tra này mô phỏng cuộc tấn công phá hoại phần mềm nhắm vào hệ thống điều khiển nhà máy điện, cho thấy AI hiện vẫn chưa thể tự mình thực hiện các cuộc tấn công mạng ở cấp độ cơ sở hạ tầng trọng yếu. Lập luận của Anthropic về việc hạn chế quyền truy cập Mythos là: công ty định vị nó như một "tài sản phòng thủ chiến lược", chỉ mở cho các cơ quan chính phủ đáng tin cậy và một số ít đối tác. Từ góc độ phòng thủ, logic này có lý: kiểm soát AI an ninh mạnh nhất trong môi trường được giám sát để ngăn chặn bị lạm dụng. Nhưng dữ liệu của AISI đã xé toạc một vết nứt trong logic này. Nếu GPT-5.5 tương đương với Mythos Preview ở hầu hết các chỉ số quan trọng, mà GPT-5.5 đã mở cho bất kỳ người dùng trả phí nào, thì rốt cuộc Anthropic đang ngăn chặn điều gì? Trên SWE-bench Pro (bài kiểm tra tiêu chuẩn đánh giá khả năng sửa lỗi phần mềm thực tế của AI), Mythos Preview thực sự dẫn trước với 64.3% so với 58.6% của GPT-5.5, cho thấy vẫn có khoảng cách trong một số kịch bản kỹ thuật an ninh. Nhưng điều này không đủ để củng cố câu

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-03

Kiểm tra bảo mật của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, đánh giá mới nhất đã bác bỏ lý do của Anthropic cho rằng nó quá nguy hiểm để công khai.

Độ tương đồng 420%關鍵字 anthropic/資安測試與/claude同分類 zh

2026-04-23

CEO OpenAI Sam Altman chỉ trích Anthropic: Tiếp thị nỗi sợ hãi Claude Mythos chỉ để độc quyền AI

Độ tương đồng 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-04-22

Bloomberg tiết lộ Claude Mythos đã bị truy cập trái phép! Lỗ hổng khó phòng thủ nhất của Anthropic luôn là "con người"

Độ tương đồng 190%關鍵字 claude/anthropic/mythos同分類 zh

2026-05-28