要聞列表OpenAI 的 GPT-5.5 在網路攻擊能力上與 Claude Mythos 相當:AI Security Institute
Decrypt2026-05-01 16:56:55 熱門

OpenAI 的 GPT-5.5 在網路攻擊能力上與 Claude Mythos 相當:AI Security Institute

ORIGINALOpenAI's GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities: AI Security Institute
AI 影響分析Grok 分析中...
📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4185 字
簡要說明 - GPT-5.5 能自主執行複雜的網路攻擊,在 10 分鐘內完成 32 個步驟的企業網路模擬並破解一項耗時 12 小時的安全性難題。 - 開發者社群的進攻型 AI 網路能力正迅速提升,AISI 警告後續進展可能會接連出現。 - 研究人員發現了一種能完全繞過 GPT-5.5 安全防護機制的越獄方法,引發警示。 英國政府機構發現,OpenAI 最新的人工智慧模型能自主執行複雜的網路攻擊,且在 10 分鐘多一點的時間內破解了一項人類安全專家需耗時約 12 小時才能完成的逆向工程挑戰。 隸屬於英國科學、創新與技術部的研究機構 AI Security Institute (AISI) 於週四發布研究結果,顯示 GPT-5.5 是該機構評估過進攻型網路能力最強的模型之一,其表現與 Anthropic 備受推崇的 Claude Mythos 大致相當。 報告指出,GPT-5.5 是第二個完成 AISI 最嚴苛測試(一項名為「The Last Ones」的 32 步驟模擬企業網路攻擊)的模型,在 10 次嘗試中成功自主完成了 2 次。首個達成此里程碑的模型是 Anthropic 的 Claude Mythos Preview,在 10 次嘗試中完成了 3 次。 這項與網路安全公司 SpecterOps 共同建立的企業網路模擬,要求代理程式串聯偵察、憑證竊取、跨多個 Active Directory 林的橫向移動、透過 CI/CD 管線進行供應鏈轉向,並最終竊取受保護的內部資料庫;AISI 估計人類專家完成這些步驟約需 20 小時。 最驚人的結果或許與一項極其困難的逆向工程難題有關。GPT-5.5 在 10 分鐘 22 秒內解決了這項挑戰,且 API 使用成本僅為 1.73 美元;該挑戰要求重建自訂虛擬機的指令集、從零編寫反組譯器,並透過約束求解恢復加密密碼。而人類專家使用專業工具則需要約 12 小時。 在 AISI 的一系列進階網路安全任務中,GPT-5.5 在難度最高的「Expert」級別達到了 71.4% 的平均通過率,略高於 Mythos Preview 的 68.6%,並顯著超越了 GPT-5.4 的 52.4%。 這些發現對 AI 發展的整體軌跡具有明確的啟示。AISI 總結認為,GPT-5.5 的表現顯示網路能力的快速提升可能是一種普遍趨勢,而非單一的突破;並警告若進攻型網路技能是推理、編碼和自主任務完成能力廣泛提升的副產品,那麼後續的進展可能會接連出現。 該報告也對模型的安全防護機制提出了重大擔憂。研究人員發現了一種通用越獄方法,能在所有測試的惡意網路查詢中引發有害內容,包括在多輪代理程式設定中。該攻擊耗費了專家 6 小時的紅隊測試才開發出來。OpenAI 隨後更新了其防護堆疊,但由於配置問題,AISI 無法驗證最終版本是否有效。 AISI 提醒,其能力評估是在受控的研究環境中進行的,並不一定反映普通用戶可存取的內容,並指出公開部署的版本包含額外的防護措施與存取控制。 這份報告發布的背景,正值英國網路安全令人擔憂之際。英國政府週四同步發布的年度網路安全漏洞調查顯示,43% 的企業在過去 12 個月內遭受過網路入侵或攻擊。 對此,政府宣布投入 9000 萬英鎊的新資金以提升網路韌性,並表示將推動《Cyber Security and Resilience Bill》以保護基礎服務。官員們也發布了指導方針,敦促各組織為新發現的軟體漏洞激增做好準備,因為 AI 加速了安全漏洞被發現與武器化的速度。
資料狀態✓ 已擷取全文閱讀原文(Decrypt)
🔍歷史類似事件· 關鍵字 + 標的比對6 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:fe7dd32a9d
來源:Decrypt
發佈:2026-05-01 16:56:55
分類:hot · 導出分類 hot
標的:未指定
社群投票:+0 /0 · ⭐ 1 重要 · 💬 0 留言
OpenAI 的 GPT-5.5 在網路攻擊能力上與 Claude Mythos 相當:AI Security Institute | Feel.Trading