要聞列表Claude Opus 3.5 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?
動區 BlockTempo2026-04-18 06:04:04

Claude Opus 3.5 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?

ORIGINALClaude Opus 4.7 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?
AI 影響分析Grok 分析中...
📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4825 字
Anthropic 4 月 16 日發布 Claude Opus 4.7,主打 coding 大幅躍進(SWE-bench Pro 衝 64.3%,較前代 4.6 的 53.4% 提升 10.9 分)、視覺解析度加強三倍、1M context 維持標準價沒加 long-context premium。不過部分用戶還是反應不少痛點。 (前情提要:Claude Code 用起來變笨了?AMD AI 總監開砲:思考深度暴跌 67%、API 月費暴漲 144 倍) (背景補充:大賣空麥可貝瑞放話:Anthropic 正在吃掉 Palantir) Anthropic 在 4 月 16 日把 Claude Opus 4.7 正式推上 API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 四大雲平台,GitHub Copilot Pro+、Business、Enterprise 使用者也同步收到。 和 4.6 版本比,這次升級的方向明確,包括加強 coding 能力是絕對主線、視覺是第二優先、而 API 改動則是老使用者最有感也最有爭議的部分。 這篇文章我整理了新功能、我自己測下來的感覺,還有社群反應兩極的缺點。 要搞懂 Opus 4.7,得先理解它在 Anthropic 模型階梯上的位置。Anthropic 內部還有一個能力上限更高的 Mythos(神話),因為大規模發現零日漏洞能力被判定為國家安全風險,目前不對外發布,只給聯邦機構與 Project Glasswing 合作名單內的關鍵基礎設施廠商用。 Opus 4.7 則是「公開能賣的最強」目前民用版本。 這是 Anthropic 的策略底層,執行長 Dario Amodei 在《金融時報》專訪裡估算,中國開源模型最快 6 個月、最慢 12 個月就會追上 Mythos 的能力,在那之前 Opus 4.7 是 Anthropic 能給市場的最強商用模型。 新功能清單裡,最能打的是這三個升級點: Coding 能力大幅躍進。 SWE-bench Pro(評估 AI 解真實 GitHub issue 的 benchmark)從 4.6 的 53.4% 直接跳到 64.3%,提升 10.9 分。這個成績在公開模型中排第一,超越 GPT-5.4 的 57.7% 和 Gemini 3.1 Pro 的 54.2%。SWE-bench Verified 也從 80.8% 升到 87.6%。 專門衡量 Cursor IDE 自主 coding 表現的 CursorBench,從 58% 衝到 70%。Anthropic 自己的說法是「你之前需要密切監督才敢交出去的 coding 任務,現在可以比較放心交給 4.7」。 多步 agentic 工作流(multi-step agentic workflow,讓 Claude 一次完成包含多個工具呼叫的任務)用起來也很有感覺。 官方宣稱相較 4.6 有 14% 改進、用更少 tokens、而 tool 使用錯誤降到大約 1/3。這個數字跟我自己測下來的體感蠻吻合,下一節會講。 視覺能力三倍提升 Opus 4.7 是第一個支援高解析度影像的 Claude 模型,最大可以到 2576px / 3.75MP,等於 4.6 的三倍。 用起來是截圖可以直接丟,不用先 resize,PDF 圖表、IDE 截圖、設計稿等等,它能把更多細節記下來。 跑分的話,視覺相關 benchmark 有 13% 提升。 1M token context 沒漲價 context window 從 200K 擴到 1M 沒有漲價是大家很關注的一點,先前用戶很擔心漲價或是把上下文窗口縮回 200k,更關鍵的是 Anthropic 沒有收 long-context premium(長上下文溢價)。 以前 Claude 超過 200K tokens 的請求會加錢,4.7 直接全部按 $5 / $25 per million tokens 的標價走。搭配 128K max output tokens,長程式碼庫分析、長合約審閱、長 log 診斷之類的工作流,不用再切 chunk。 新功能列表裡,這塊改最多,也引來很多爭議。 新增 xhigh(extra high)effort level 以前 Claude 的推理力道有 high 和 max 兩級,4.
資料狀態✓ 已擷取全文閱讀原文(動區 BlockTempo)
🔍歷史類似事件· 關鍵字 + 標的比對6 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:31d7924b05
來源:動區 BlockTempo
發佈:2026-04-18 06:04:04
分類:zh_news · 導出分類 zh
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言