GPT-5.5 của OpenAI ngang bằng với Claude Mythos về khả năng tấn công mạng: AI Security Institute

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯4185 từ

Tóm tắt - GPT-5.5 có thể tự động thực hiện các cuộc tấn công mạng tinh vi, hoàn thành mô phỏng mạng doanh nghiệp gồm 32 bước và giải mã một câu đố bảo mật 12 giờ chỉ trong 10 phút. - Khả năng tấn công mạng của AI đang cải thiện nhanh chóng giữa các nhà phát triển, với AISI cảnh báo rằng những tiến bộ tiếp theo có thể đến liên tiếp. - Các nhà nghiên cứu đã tìm thấy một lỗ hổng jailbreak vượt qua hoàn toàn các rào cản an toàn của GPT-5.5, gây ra sự báo động. Một cơ quan chính phủ Vương quốc Anh đã phát hiện ra rằng mô hình trí tuệ nhân tạo mới nhất của OpenAI có thể tự động thực hiện các cuộc tấn công mạng phức tạp—và nó đã giải quyết một thử thách kỹ thuật đảo ngược chỉ trong hơn 10 phút, trong khi một chuyên gia bảo mật con người mất khoảng 12 giờ. Viện An ninh AI (AISI), một cơ quan nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ Anh, đã công bố các phát hiện vào thứ Năm cho thấy GPT-5.5 là một trong những mô hình mạnh nhất mà họ từng đánh giá về khả năng tấn công mạng, ngang ngửa với Claude Mythos được ca ngợi của Anthropic. Báo cáo cho thấy GPT-5.5 là mô hình thứ hai hoàn thành bài kiểm tra khắt khe nhất của AISI—một cuộc tấn công mô phỏng mạng doanh nghiệp gồm 32 bước có tên "The Last Ones"—thực hiện tự động trong hai trên 10 lần thử. Mô hình đầu tiên đạt được cột mốc này là Claude Mythos Preview của Anthropic, đã hoàn thành mô phỏng trong ba trên 10 lần thử. Mô phỏng mạng doanh nghiệp, được xây dựng cùng với công ty an ninh mạng SpecterOps, yêu cầu một tác nhân phải kết nối các bước trinh sát, đánh cắp thông tin xác thực, di chuyển ngang qua nhiều Active Directory forest, xoay trục chuỗi cung ứng thông qua đường ống CI/CD và cuối cùng là trích xuất cơ sở dữ liệu nội bộ được bảo vệ—các bước mà AISI ước tính sẽ mất một chuyên gia con người khoảng 20 giờ. Có lẽ kết quả đáng chú ý nhất liên quan đến một câu đố kỹ thuật đảo ngược cực kỳ khó. GPT-5.5 đã giải quyết thử thách này—yêu cầu tái tạo tập lệnh của một máy ảo tùy chỉnh, viết một trình tháo gỡ từ đầu và khôi phục mật khẩu mật mã thông qua giải quyết ràng buộc—trong 10 phút 22 giây, với chi phí 1,73 đô la cho việc sử dụng API. Một chuyên gia con người, sử dụng các công cụ chuyên nghiệp, cần khoảng 12 giờ. Trong chuỗi các nhiệm vụ an ninh mạng nâng cao của AISI, GPT-5.5 đạt tỷ lệ vượt qua trung bình 71,4% ở cấp độ "Expert" khó nhất, vượt qua Mythos Preview với 68,6% và vượt xa GPT-5.4 với 52,4%. Những phát hiện này mang lại những hàm ý rõ rệt cho quỹ đạo rộng lớn hơn của sự phát triển AI. AISI kết luận rằng hiệu suất của GPT-5.5 cho thấy sự cải thiện nhanh chóng về khả năng mạng có thể là một phần của xu hướng chung thay vì một bước đột phá riêng lẻ—và cảnh báo rằng nếu kỹ năng tấn công mạng đang nổi lên như một sản phẩm phụ của những cải tiến rộng hơn trong lập luận, lập trình và hoàn thành nhiệm vụ tự động, thì những tiến bộ tiếp theo có thể đến liên tiếp. Báo cáo cũng gắn cờ những lo ngại đáng kể về các rào cản an toàn của mô hình. Các nhà nghiên cứu đã xác định một lỗ hổng jailbreak phổ quát có thể tạo ra nội dung độc hại trên tất cả các truy vấn mạng độc hại được kiểm tra, bao gồm cả trong các cài đặt tác nhân đa lượt. Cuộc tấn công mất sáu giờ để các chuyên gia red-teaming phát triển. OpenAI sau đó đã cập nhật ngăn xếp bảo vệ của mình, mặc dù một vấn đề cấu hình đã ngăn cản AISI xác minh xem phiên bản cuối cùng có hiệu quả hay không. AISI cảnh báo rằng các đánh giá khả năng của họ được thực hiện trong môi trường nghiên cứu được kiểm soát và không nhất thiết phản ánh những gì người dùng bình thường có thể truy cập, lưu ý rằng các triển khai công khai bao gồm các biện pháp bảo vệ và kiểm soát truy cập bổ sung. Báo cáo xuất hiện trong bối cảnh đáng lo ngại đối với an ninh mạng của Anh. Khảo sát vi phạm an ninh mạng hàng

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-12

OpenAI ra mắt chương trình bảo mật Daybreak: Bốn năng lực phát hiện lỗ hổng rủi ro cao, trực tiếp thách thức Claude Mythos

Độ tương đồng 180%關鍵字 claude/mythos/openai

2026-05-03

Kiểm tra bảo mật của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, đánh giá mới nhất đã bác bỏ lý do của Anthropic cho rằng nó quá nguy hiểm để công khai.

Độ tương đồng 180%關鍵字 claude/gpt/mythos

2026-05-03

Kết quả kiểm tra an ninh của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, bác bỏ lý do của Anthropic rằng nó quá nguy hiểm để công khai.

Độ tương đồng 180%關鍵字 claude/gpt/mythos

2026-05-28