Danh sách tinGPT-5.5 của OpenAI ngang bằng với Claude Mythos về khả năng tấn công mạng: AI Security Institute
Decrypt2026-05-01 16:56:55 Nóng

GPT-5.5 của OpenAI ngang bằng với Claude Mythos về khả năng tấn công mạng: AI Security Institute

ORIGINALOpenAI's GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities: AI Security Institute
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯4185 từ
Tóm tắt - GPT-5.5 có thể tự động thực hiện các cuộc tấn công mạng tinh vi, hoàn thành mô phỏng mạng doanh nghiệp gồm 32 bước và giải mã một câu đố bảo mật 12 giờ chỉ trong 10 phút. - Khả năng tấn công mạng của AI đang cải thiện nhanh chóng giữa các nhà phát triển, với AISI cảnh báo rằng những tiến bộ tiếp theo có thể đến liên tiếp. - Các nhà nghiên cứu đã tìm thấy một lỗ hổng jailbreak vượt qua hoàn toàn các rào cản an toàn của GPT-5.5, gây ra sự báo động. Một cơ quan chính phủ Vương quốc Anh đã phát hiện ra rằng mô hình trí tuệ nhân tạo mới nhất của OpenAI có thể tự động thực hiện các cuộc tấn công mạng phức tạp—và nó đã giải quyết một thử thách kỹ thuật đảo ngược chỉ trong hơn 10 phút, trong khi một chuyên gia bảo mật con người mất khoảng 12 giờ. Viện An ninh AI (AISI), một cơ quan nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ Anh, đã công bố các phát hiện vào thứ Năm cho thấy GPT-5.5 là một trong những mô hình mạnh nhất mà họ từng đánh giá về khả năng tấn công mạng, ngang ngửa với Claude Mythos được ca ngợi của Anthropic. Báo cáo cho thấy GPT-5.5 là mô hình thứ hai hoàn thành bài kiểm tra khắt khe nhất của AISI—một cuộc tấn công mô phỏng mạng doanh nghiệp gồm 32 bước có tên "The Last Ones"—thực hiện tự động trong hai trên 10 lần thử. Mô hình đầu tiên đạt được cột mốc này là Claude Mythos Preview của Anthropic, đã hoàn thành mô phỏng trong ba trên 10 lần thử. Mô phỏng mạng doanh nghiệp, được xây dựng cùng với công ty an ninh mạng SpecterOps, yêu cầu một tác nhân phải kết nối các bước trinh sát, đánh cắp thông tin xác thực, di chuyển ngang qua nhiều Active Directory forest, xoay trục chuỗi cung ứng thông qua đường ống CI/CD và cuối cùng là trích xuất cơ sở dữ liệu nội bộ được bảo vệ—các bước mà AISI ước tính sẽ mất một chuyên gia con người khoảng 20 giờ. Có lẽ kết quả đáng chú ý nhất liên quan đến một câu đố kỹ thuật đảo ngược cực kỳ khó. GPT-5.5 đã giải quyết thử thách này—yêu cầu tái tạo tập lệnh của một máy ảo tùy chỉnh, viết một trình tháo gỡ từ đầu và khôi phục mật khẩu mật mã thông qua giải quyết ràng buộc—trong 10 phút 22 giây, với chi phí 1,73 đô la cho việc sử dụng API. Một chuyên gia con người, sử dụng các công cụ chuyên nghiệp, cần khoảng 12 giờ. Trong chuỗi các nhiệm vụ an ninh mạng nâng cao của AISI, GPT-5.5 đạt tỷ lệ vượt qua trung bình 71,4% ở cấp độ "Expert" khó nhất, vượt qua Mythos Preview với 68,6% và vượt xa GPT-5.4 với 52,4%. Những phát hiện này mang lại những hàm ý rõ rệt cho quỹ đạo rộng lớn hơn của sự phát triển AI. AISI kết luận rằng hiệu suất của GPT-5.5 cho thấy sự cải thiện nhanh chóng về khả năng mạng có thể là một phần của xu hướng chung thay vì một bước đột phá riêng lẻ—và cảnh báo rằng nếu kỹ năng tấn công mạng đang nổi lên như một sản phẩm phụ của những cải tiến rộng hơn trong lập luận, lập trình và hoàn thành nhiệm vụ tự động, thì những tiến bộ tiếp theo có thể đến liên tiếp. Báo cáo cũng gắn cờ những lo ngại đáng kể về các rào cản an toàn của mô hình. Các nhà nghiên cứu đã xác định một lỗ hổng jailbreak phổ quát có thể tạo ra nội dung độc hại trên tất cả các truy vấn mạng độc hại được kiểm tra, bao gồm cả trong các cài đặt tác nhân đa lượt. Cuộc tấn công mất sáu giờ để các chuyên gia red-teaming phát triển. OpenAI sau đó đã cập nhật ngăn xếp bảo vệ của mình, mặc dù một vấn đề cấu hình đã ngăn cản AISI xác minh xem phiên bản cuối cùng có hiệu quả hay không. AISI cảnh báo rằng các đánh giá khả năng của họ được thực hiện trong môi trường nghiên cứu được kiểm soát và không nhất thiết phản ánh những gì người dùng bình thường có thể truy cập, lưu ý rằng các triển khai công khai bao gồm các biện pháp bảo vệ và kiểm soát truy cập bổ sung. Báo cáo xuất hiện trong bối cảnh đáng lo ngại đối với an ninh mạng của Anh. Khảo sát vi phạm an ninh mạng hàng
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:fe7dd32a9d
Nguồn:Decrypt
Đăng:2026-05-01 16:56:55
Danh mục:hot · Danh mục xuất hot
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 1 quan trọng · 💬 0 bình luận
GPT-5.5 của OpenAI ngang bằng với Claude Mythos về khả năng tấn công mạng: AI Security Institute | Feel.Trading