OpenAI 的 GPT-5.5 在網路攻擊能力上與 Claude Mythos 相當：AI Security Institute

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4185 字

簡要說明 - GPT-5.5 能自主執行複雜的網路攻擊，在 10 分鐘內完成 32 個步驟的企業網路模擬並破解一項耗時 12 小時的安全性難題。 - 開發者社群的進攻型 AI 網路能力正迅速提升，AISI 警告後續進展可能會接連出現。 - 研究人員發現了一種能完全繞過 GPT-5.5 安全防護機制的越獄方法，引發警示。英國政府機構發現，OpenAI 最新的人工智慧模型能自主執行複雜的網路攻擊，且在 10 分鐘多一點的時間內破解了一項人類安全專家需耗時約 12 小時才能完成的逆向工程挑戰。隸屬於英國科學、創新與技術部的研究機構 AI Security Institute (AISI) 於週四發布研究結果，顯示 GPT-5.5 是該機構評估過進攻型網路能力最強的模型之一，其表現與 Anthropic 備受推崇的 Claude Mythos 大致相當。報告指出，GPT-5.5 是第二個完成 AISI 最嚴苛測試（一項名為「The Last Ones」的 32 步驟模擬企業網路攻擊）的模型，在 10 次嘗試中成功自主完成了 2 次。首個達成此里程碑的模型是 Anthropic 的 Claude Mythos Preview，在 10 次嘗試中完成了 3 次。這項與網路安全公司 SpecterOps 共同建立的企業網路模擬，要求代理程式串聯偵察、憑證竊取、跨多個 Active Directory 林的橫向移動、透過 CI/CD 管線進行供應鏈轉向，並最終竊取受保護的內部資料庫；AISI 估計人類專家完成這些步驟約需 20 小時。最驚人的結果或許與一項極其困難的逆向工程難題有關。GPT-5.5 在 10 分鐘 22 秒內解決了這項挑戰，且 API 使用成本僅為 1.73 美元；該挑戰要求重建自訂虛擬機的指令集、從零編寫反組譯器，並透過約束求解恢復加密密碼。而人類專家使用專業工具則需要約 12 小時。在 AISI 的一系列進階網路安全任務中，GPT-5.5 在難度最高的「Expert」級別達到了 71.4% 的平均通過率，略高於 Mythos Preview 的 68.6%，並顯著超越了 GPT-5.4 的 52.4%。這些發現對 AI 發展的整體軌跡具有明確的啟示。AISI 總結認為，GPT-5.5 的表現顯示網路能力的快速提升可能是一種普遍趨勢，而非單一的突破；並警告若進攻型網路技能是推理、編碼和自主任務完成能力廣泛提升的副產品，那麼後續的進展可能會接連出現。該報告也對模型的安全防護機制提出了重大擔憂。研究人員發現了一種通用越獄方法，能在所有測試的惡意網路查詢中引發有害內容，包括在多輪代理程式設定中。該攻擊耗費了專家 6 小時的紅隊測試才開發出來。OpenAI 隨後更新了其防護堆疊，但由於配置問題，AISI 無法驗證最終版本是否有效。 AISI 提醒，其能力評估是在受控的研究環境中進行的，並不一定反映普通用戶可存取的內容，並指出公開部署的版本包含額外的防護措施與存取控制。這份報告發布的背景，正值英國網路安全令人擔憂之際。英國政府週四同步發布的年度網路安全漏洞調查顯示，43% 的企業在過去 12 個月內遭受過網路入侵或攻擊。對此，政府宣布投入 9000 萬英鎊的新資金以提升網路韌性，並表示將推動《Cyber Security and Resilience Bill》以保護基礎服務。官員們也發布了指導方針，敦促各組織為新發現的軟體漏洞激增做好準備，因為 AI 加速了安全漏洞被發現與武器化的速度。

資料狀態✓ 已擷取全文閱讀原文（Decrypt）

🔍歷史類似事件· 關鍵字 + 標的比對6 則

2026-05-12

OpenAI 推出 Daybreak 資安計畫：四大能力偵測高風險漏洞，正面挑戰 Claude Mythos

相似度 180%關鍵字 claude/mythos/openai

2026-05-03

GPT-5.5 資安測試與 Claude Mythos 幾乎同分，最新評測打臉 Anthropic 太危險不能公開理由

相似度 180%關鍵字 claude/gpt/mythos

2026-05-03

GPT-5.5 資安測試與 Claude Mythos 幾乎同分，打臉 Anthropic 太危險不能公開理由

相似度 180%關鍵字 claude/gpt/mythos

2026-05-28

Anthropic 預告數週內全面開放超級模型 Claude Mythos！駭客級 AI 即將解禁

相似度 170%關鍵字 claude/mythos同分類 hot

2026-05-28

Anthropic 的 Claude Mythos AI 模型即將發布，引發資安警報

相似度 170%關鍵字 claude/mythos同分類 hot

2026-05-14

OpenAI 證實安全漏洞與 AI 惡意軟體攻擊活動有關

相似度 170%關鍵字 security/openai同分類 hot

💡 目前用關鍵字 + 標的比對（MVP）· 之後會升級為 embedding 語意搜尋

原始資訊

ID：fe7dd32a9d

來源：Decrypt

發佈：2026-05-01 16:56:55

分類：hot · 導出分類 hot

標的：未指定

社群投票：+0 / −0 · ⭐ 1 重要 · 💬 0 留言