要闻列表OpenAI 的 GPT-5.5 在網絡攻擊能力上與 Claude Mythos 持平:AI Security Institute
Decrypt2026-05-01 16:56:55 热门

OpenAI 的 GPT-5.5 在網絡攻擊能力上與 Claude Mythos 持平:AI Security Institute

ORIGINALOpenAI's GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities: AI Security Institute
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯4185 字
简而言之 - GPT-5.5 可以自主执行复杂的网络攻击,在 10 分钟内完成了 32 步企业网络模拟并破解了一道耗时 12 小时的安全难题。 - 进攻性 AI 网络能力在开发者群体中迅速提升,AISI 警告称,进一步的进展可能会接踵而至。 - 研究人员发现了一种完全绕过 GPT-5.5 安全护栏的越狱方法,引发了警报。 英国政府的一家机构发现,OpenAI 最新的人工智能模型能够自主执行复杂的网络攻击,并且在 10 分多钟内破解了一项人类安全专家需要约 12 小时才能完成的逆向工程挑战。 英国科学、创新和技术部下属的研究机构 AI Security Institute (AISI) 周四发布的研究结果显示,GPT-5.5 是其评估过的进攻性网络能力最强的模型之一,其水平大致与 Anthropic 备受推崇的 Claude Mythos 持平。 报告发现,GPT-5.5 是第二个完成 AISI 最严苛测试(一项名为“The Last Ones”的 32 步模拟企业网络攻击)的模型,在 10 次尝试中自主完成了 2 次。第一个达到这一里程碑的模型是 Anthropic 的 Claude Mythos Preview,它在 10 次尝试中完成了 3 次。 这项与网络安全公司 SpecterOps 共同构建的企业网络模拟要求智能体将侦察、凭据窃取、跨多个 Active Directory 林的横向移动、通过 CI/CD 流水线的供应链枢轴,以及最终提取受保护的内部数据库等步骤串联起来——AISI 估计人类专家完成这些步骤大约需要 20 小时。 也许最引人注目的结果涉及一道极其困难的逆向工程难题。GPT-5.5 在 10 分 22 秒内解决了这一挑战,耗费的 API 使用成本为 1.73 美元。该挑战要求重构自定义虚拟机的指令集、从零开始编写反汇编程序,并通过约束求解恢复加密密码。而一名使用专业工具的人类专家大约需要 12 小时。 在 AISI 的一系列高级网络安全任务中,GPT-5.5 在难度最高的“专家”级别上取得了 71.4% 的平均通过率,略高于 Mythos Preview 的 68.6%,并显著超过了 GPT-5.4 的 52.4%。 这些发现对 AI 发展的更广泛轨迹具有明确的启示。AISI 得出结论称,GPT-5.5 的表现表明网络能力的快速提升可能是一种普遍趋势,而非孤立的突破,并警告称,如果进攻性网络技能是推理、编码和自主任务完成能力全面提升的副产品,那么进一步的进展可能会接踵而至。 该报告还指出了关于模型安全护栏的重大担忧。研究人员发现了一种通用越狱方法,可以在所有测试的恶意网络查询中诱导出有害内容,包括在多轮智能体设置中。开发这种攻击耗费了专家团队 6 小时的红队测试。OpenAI 随后更新了其安全堆栈,但由于配置问题,AISI 无法验证最终版本是否有效。 AISI 提醒称,其能力评估是在受控的研究环境中进行的,并不一定反映普通用户所能接触到的情况,并指出公开部署的版本包含额外的安全措施和访问控制。 该报告发布之际,英国的网络安全正处于令人担忧的背景之下。英国政府周四发布的年度《网络安全漏洞调查》显示,43% 的企业在过去 12 个月内遭受过网络漏洞攻击或入侵。 作为回应,政府宣布投入 9000 万英镑的新资金以提高网络韧性,并表示正在推进《网络安全与韧性法案》以保护基本服务。官员们还发布了指导意见,敦促各组织为新发现的软件漏洞激增做好准备,因为 AI 加快了发现和利用安全漏洞的速度。
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:fe7dd32a9d
来源:Decrypt
发布:2026-05-01 16:56:55
分类:hot · 导出分类 hot
标的:未指定
社群投票:+0 /0 · ⭐ 1 重要 · 💬 0 留言
OpenAI 的 GPT-5.5 在網絡攻擊能力上與 Claude Mythos 持平:AI Security Institute | Feel.Trading