OpenAI 的 GPT-5.5 在網絡攻擊能力上與 Claude Mythos 持平：AI Security Institute

📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯4185 字

简而言之 - GPT-5.5 可以自主执行复杂的网络攻击，在 10 分钟内完成了 32 步企业网络模拟并破解了一道耗时 12 小时的安全难题。 - 进攻性 AI 网络能力在开发者群体中迅速提升，AISI 警告称，进一步的进展可能会接踵而至。 - 研究人员发现了一种完全绕过 GPT-5.5 安全护栏的越狱方法，引发了警报。英国政府的一家机构发现，OpenAI 最新的人工智能模型能够自主执行复杂的网络攻击，并且在 10 分多钟内破解了一项人类安全专家需要约 12 小时才能完成的逆向工程挑战。英国科学、创新和技术部下属的研究机构 AI Security Institute (AISI) 周四发布的研究结果显示，GPT-5.5 是其评估过的进攻性网络能力最强的模型之一，其水平大致与 Anthropic 备受推崇的 Claude Mythos 持平。报告发现，GPT-5.5 是第二个完成 AISI 最严苛测试（一项名为“The Last Ones”的 32 步模拟企业网络攻击）的模型，在 10 次尝试中自主完成了 2 次。第一个达到这一里程碑的模型是 Anthropic 的 Claude Mythos Preview，它在 10 次尝试中完成了 3 次。这项与网络安全公司 SpecterOps 共同构建的企业网络模拟要求智能体将侦察、凭据窃取、跨多个 Active Directory 林的横向移动、通过 CI/CD 流水线的供应链枢轴，以及最终提取受保护的内部数据库等步骤串联起来——AISI 估计人类专家完成这些步骤大约需要 20 小时。也许最引人注目的结果涉及一道极其困难的逆向工程难题。GPT-5.5 在 10 分 22 秒内解决了这一挑战，耗费的 API 使用成本为 1.73 美元。该挑战要求重构自定义虚拟机的指令集、从零开始编写反汇编程序，并通过约束求解恢复加密密码。而一名使用专业工具的人类专家大约需要 12 小时。在 AISI 的一系列高级网络安全任务中，GPT-5.5 在难度最高的“专家”级别上取得了 71.4% 的平均通过率，略高于 Mythos Preview 的 68.6%，并显著超过了 GPT-5.4 的 52.4%。这些发现对 AI 发展的更广泛轨迹具有明确的启示。AISI 得出结论称，GPT-5.5 的表现表明网络能力的快速提升可能是一种普遍趋势，而非孤立的突破，并警告称，如果进攻性网络技能是推理、编码和自主任务完成能力全面提升的副产品，那么进一步的进展可能会接踵而至。该报告还指出了关于模型安全护栏的重大担忧。研究人员发现了一种通用越狱方法，可以在所有测试的恶意网络查询中诱导出有害内容，包括在多轮智能体设置中。开发这种攻击耗费了专家团队 6 小时的红队测试。OpenAI 随后更新了其安全堆栈，但由于配置问题，AISI 无法验证最终版本是否有效。 AISI 提醒称，其能力评估是在受控的研究环境中进行的，并不一定反映普通用户所能接触到的情况，并指出公开部署的版本包含额外的安全措施和访问控制。该报告发布之际，英国的网络安全正处于令人担忧的背景之下。英国政府周四发布的年度《网络安全漏洞调查》显示，43% 的企业在过去 12 个月内遭受过网络漏洞攻击或入侵。作为回应，政府宣布投入 9000 万英镑的新资金以提高网络韧性，并表示正在推进《网络安全与韧性法案》以保护基本服务。官员们还发布了指导意见，敦促各组织为新发现的软件漏洞激增做好准备，因为 AI 加快了发现和利用安全漏洞的速度。

数据状态✓ 已抓取全文阅读原文（Decrypt）

🔍历史类似事件· 关键词 + 标的比对6 则

2026-05-12

OpenAI 推出 Daybreak 資安計畫：四大能力偵測高風險漏洞，正面挑戰 Claude Mythos

相似度 180%關鍵字 claude/mythos/openai

2026-05-03

GPT-5.5 在資安測試中與 Claude Mythos 幾乎同分，最新評測打臉了 Anthropic 稱其太危險而不能公開的理由。

相似度 180%關鍵字 claude/gpt/mythos

2026-05-03

GPT-5.5 在資安測試中與 Claude Mythos 幾乎同分，打臉了 Anthropic 稱其太危險而不能公開的理由。

相似度 180%關鍵字 claude/gpt/mythos

2026-05-14

OpenAI确认发生与AI恶意软件活动相关的安全漏洞事件

相似度 170%關鍵字 security/openai同分類 hot

2026-04-23

OpenAI 发布 GPT-5.5 以挑战 Anthropic 的 Claude Opus 4.7

相似度 150%關鍵字 claude/gpt/openai

2026-04-23

OpenAI 執行長 Sam Altman 砲轟 Anthropic：恐懼行銷 Claude Mythos 只為壟斷 AI

相似度 150%關鍵字 claude/mythos/openai

💡 目前用关键词 + 标的比对（MVP）· 之后会升级为 embedding 语义搜寻

原始信息

ID：fe7dd32a9d

来源：Decrypt

发布：2026-05-01 16:56:55

分类：hot · 导出分类 hot

标的：未指定

社群投票：+0 / −0 · ⭐ 1 重要 · 💬 0 留言