要闻列表OpenAI 发布 GPT-5.5:更快、更智能——且更昂贵
Decrypt2026-04-23 18:25:16

OpenAI 发布 GPT-5.5:更快、更智能——且更昂贵

ORIGINALOpenAI Releases GPT-5.5: Faster, Smarter—And Pricier
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯5116 字
简要总结 - GPT-5.5 今日起面向 ChatGPT 和 Codex 的 Plus、Pro、Business 及 Enterprise 用户推出,API 访问权限即将上线,定价为每百万输入 token 5 美元,每百万输出 token 30 美元。 - 该模型在 Terminal-Bench 2.0(一项测试复杂命令行工作流的基准测试)中取得了 82.7% 的成绩,击败了 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%。 - GPT-5.5 完成相同 Codex 任务所需的 token 显著少于 GPT-5.4,尽管定价更高,但效率更高。 OpenAI 于周四发布了 GPT-5.5,将其定位为主要针对智能体(agentic)计算机操作的模型。它能够编写和调试代码、浏览网页、填写电子表格,并持续完成多步骤任务,无需人类时刻监督每一步操作。 OpenAI 表示,该版本今日起已向 ChatGPT 和 Codex 的 Plus、Pro、Business 和 Enterprise 订阅用户推送。 “我们发布了 GPT-5.5,这是我们迄今为止最智能、最直观的模型,也是迈向计算机工作新方式的下一步,”OpenAI 在公告中称。“在智能体编码、计算机操作、知识工作和早期科学研究领域,进步尤为显著——这些领域的发展依赖于跨上下文的推理和长期的行动能力。” 介绍 GPT-5.5 一种用于实际工作和驱动智能体的新型智能,旨在理解复杂目标、使用工具、检查工作成果并完成更多任务。它标志着计算机工作方式的革新。 现已在 ChatGPT 和 Codex 中可用。pic.twitter.com/rPLTk99ZH5 — OpenAI (@OpenAI) 2026 年 4 月 23 日 OpenAI 的核心亮点:GPT-5.5 在可衡量指标上比其前身 GPT-5.4 更智能,且速度并未下降。在实际服务中匹配 GPT-5.4 的每 token 延迟,同时在各项基准测试中获得更高分数,这种效率提升通常很难实现。更大的模型在相同硬件下运行往往更慢。 在测试模型处理需要规划和迭代工具使用的复杂命令行工作流能力的 Terminal-Bench 2.0 上,GPT-5.5 得分为 82.7%。Claude Opus 4.7 得分为 69.4%,而 Gemini 3.1 Pro 为 68.5%。这不是微小的领先。 在测试涵盖金融、法律研究到产品管理等 44 种真实职业知识工作的基准测试 GDPval 上,GPT-5.5 在 84.9% 的对比中持平或超越了行业专业人士。 正如预期,它也是一名出色的程序员。在 Expert-SWE(一项针对长周期编码任务的内部基准测试,人类完成任务的中位预估时间为 20 小时)中,GPT-5.5 的表现优于 GPT-5.4。在对真实 GitHub 问题解决能力进行评分的 SWE-Bench Pro 上,它达到了 58.6%。Claude Opus 4.7 的得分更高,为 64.3%,但 OpenAI 声称这可能是因为“Anthropic 报告了在部分问题子集上存在记忆迹象”。 此次发布正值智能体 AI 热潮推动市场快速发展的时期。GPT-5.4 在 GPT-5.3 发布仅两天后就问世了,而 Xiaomi 在大约五周内就从 MiMo-V2-Pro 升级到了具备完整多模态能力的 MiMo 2.5 Pro。GPT-5.4 和 GPT-5.5 之间的间隔约为七周。这就是现在的节奏。 但对于并非总是忙于编写下一个重大项目的普通用户来说,这个模型会有所不同吗?如果你是免费用户,答案是否定的:GPT-5.5 不会向免费用户开放。如果你是每月 20 美元的 Plus 用户,它今日起开始推送。我们尝试在我们的 Pro 账户下进行测试,但该模型并未立即可用。 更重要的可能是 GPT-5.5 在 OpenAI 的智能体编码环境 Codex 内部的表现,事实证明它在那里更强大。“感觉就像是在与更高阶的智能合作,甚至有一种敬畏感,”MagicPath 首席执行官 Pietro Schirano 在 OpenAI 分享的引言中说道。 专为更高难度、更高精度工作设计的 GPT-5.5 Pro 正在 ChatGPT 中分别向 Pro、Business 和 Enterprise 用户推送。在测试模型跨网页追踪难以获取信息能力的 BrowseComp 上,GPT-5.5 Pro 得分为 90.1%,
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对2 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:df8df99f13
来源:Decrypt
发布:2026-04-23 18:25:16
分类:一般 · 导出分类 neutral
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言