DeepSeek V4 發布，程式能力可打敗 GPT 和 Claude 嗎？費用再次屠榜

📄完整原文· 由 trafilatura 自动抓取1167 字

DeepSeek V4 預覽版於 24 日正式發布並同步開源，推出 V4-Pro（1.6 兆引數、MoE 架構）與 V4-Flash（2,840 億引數）兩款模型，支援百萬 token 上下文。（前情提要：DeepSeek V4 拒絕輝達找華為！阿里、位元組跳動、騰訊搶買昇騰950PR晶片）（背景補充：DeepSeek V4 四月下旬發布，梁文鋒內部證實：百萬 token 視窗、完全跑在華為昇騰 950 PR 晶片）社群期待已久下，DeepSeek 今（24）日正式推出最新的開源大模型 DeepSeek V4 Preview，並將 100 萬上下文列為全系列標配，那它足以匹配當前矽谷的閉源模型嗎？ SWE-bench 程式碼測試中，DeepSeek V4 Preview 以 83.7% 超越 Claude Opus 4.6（80.9%）與 GPT-5.2（80%），雖然還沒趕上最新旗艦模型，但已足夠令人驚艷。 V4 系列共推出兩款模型：V4-Pro（1.6 兆引數，每次推理啟用 490 億）與 V4-Flash（2,840 億引數，啟用 130 億）。架構是混合專家（MoE），簡單來說就是，這個模型不是每次都動員全部神經元，而是按需呼叫其中一小部分「專家」，在不犧牲回答品質的前提下大幅壓縮算力消耗。上下文視窗達到 100 萬 token。一次可以讀完整部《哈利波特》七本再加上大量程式碼庫。 DeepSeek-V4-Pro Max 不是「全面屠榜」，但它的定位很清楚：在推理、程式、Agentic 任務上非常強。 - 在知識推理接近 GPT-5.4 / Gemini-3.1-Pro / Opus-4.6 - 程式與 Agentic 能力尤其突出 - 但在部分高難度推理榜單仍被 GPT-5.4、Gemini-3.1-Pro 或 Opus-4.6 壓過。 DeepSeek-V4-Pro Max 的 Agentic 表現可以說是穩中偏強： - 它在 SWE Verified 80.6，幾乎等於 Gemini-3.1-Pro，略低於 Opus-4.6 - 在 BrowseComp 83.4，也接近 Opus-4.6 的 83.7，只輸 Gemini 的 85.9 - 在 MCPAtlas Public 73.6，幾乎追平 Opus-4.6 的 73.8，領先 GPT-5.4 與 Gemini DeepSeek V4 每百萬 token 輸入約定價 0.3 美元，比相近閉源模型便宜 27 倍。同時，V4 完全跑在華為昇騰 950 PR 晶片上，不使用輝達 CUDA。在美國出口管制持續收緊的背景下，這不只是工程選擇，也是長期生存策略，而 DeepSeek 用 V4 給出了第一個規模化可用的版本。

数据状态✓ 已抓取全文阅读原文（動區 BlockTempo）

🔍历史类似事件· 关键词 + 标的比对6 则

2026-05-03

GPT-5.5 在資安測試中與 Claude Mythos 幾乎同分，最新評測打臉了 Anthropic 稱其太危險而不能公開的理由。

相似度 140%關鍵字 claude/gpt同分類 zh

2026-05-03

GPT-5.5 在資安測試中與 Claude Mythos 幾乎同分，打臉了 Anthropic 稱其太危險而不能公開的理由。

相似度 140%關鍵字 claude/gpt同分類 zh

2026-04-24

DeepSeek V4 来了——其 Pro 版本价格比 GPT 5.5 Pro 低 98%

相似度 130%關鍵字 gpt/deepseek

2026-04-23

OpenAI 发布 GPT-5.5 以挑战 Anthropic 的 Claude Opus 4.7

相似度 130%關鍵字 claude/gpt

2026-04-29

高盛香港員工被停用 Claude，Anthropic 坦承：從未支援HK區，AI 地緣管制延燒

相似度 120%關鍵字 claude同分類 zh

2026-04-29

Claude 現可串接 Photoshop、Premiere、Blender…覆蓋影音、3D、音樂、設計（9 個新聯結器上線）

相似度 120%關鍵字 claude同分類 zh

💡 目前用关键词 + 标的比对（MVP）· 之后会升级为 embedding 语义搜寻

原始信息

ID：a2ec06cd7e

来源：動區 BlockTempo

发布：2026-04-24 06:27:38

分类：zh_news · 导出分类 zh

标的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言