要闻列表DeepSeek V4 發布,程式能力可打敗 GPT 和 Claude 嗎?費用再次屠榜
動區 BlockTempo2026-04-24 06:27:38

DeepSeek V4 發布,程式能力可打敗 GPT 和 Claude 嗎?費用再次屠榜

AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取1167 字
DeepSeek V4 預覽版於 24 日正式發布並同步開源,推出 V4-Pro(1.6 兆引數、MoE 架構)與 V4-Flash(2,840 億引數)兩款模型,支援百萬 token 上下文。 (前情提要:DeepSeek V4 拒絕輝達 找華為!阿里、位元組跳動、騰訊搶買昇騰950PR晶片) (背景補充:DeepSeek V4 四月下旬發布,梁文鋒內部證實:百萬 token 視窗、完全跑在華為昇騰 950 PR 晶片) 社群期待已久下,DeepSeek 今(24)日正式推出最新的開源大模型 DeepSeek V4 Preview,並將 100 萬上下文列為全系列標配,那它足以匹配當前矽谷的閉源模型嗎? SWE-bench 程式碼測試中,DeepSeek V4 Preview 以 83.7% 超越 Claude Opus 4.6(80.9%)與 GPT-5.2(80%),雖然還沒趕上最新旗艦模型,但已足夠令人驚艷。 V4 系列共推出兩款模型:V4-Pro(1.6 兆引數,每次推理啟用 490 億)與 V4-Flash(2,840 億引數,啟用 130 億)。 架構是混合專家(MoE),簡單來說就是,這個模型不是每次都動員全部神經元,而是按需呼叫其中一小部分「專家」,在不犧牲回答品質的前提下大幅壓縮算力消耗。 上下文視窗達到 100 萬 token。一次可以讀完整部《哈利波特》七本再加上大量程式碼庫。 DeepSeek-V4-Pro Max 不是「全面屠榜」,但它的定位很清楚:在推理、程式、Agentic 任務上非常強。 - 在知識推理接近 GPT-5.4 / Gemini-3.1-Pro / Opus-4.6 - 程式與 Agentic 能力尤其突出 - 但在部分高難度推理榜單仍被 GPT-5.4、Gemini-3.1-Pro 或 Opus-4.6 壓過。 DeepSeek-V4-Pro Max 的 Agentic 表現可以說是穩中偏強: - 它在 SWE Verified 80.6,幾乎等於 Gemini-3.1-Pro,略低於 Opus-4.6 - 在 BrowseComp 83.4,也接近 Opus-4.6 的 83.7,只輸 Gemini 的 85.9 - 在 MCPAtlas Public 73.6,幾乎追平 Opus-4.6 的 73.8,領先 GPT-5.4 與 Gemini DeepSeek V4 每百萬 token 輸入約定價 0.3 美元,比相近閉源模型便宜 27 倍。 同時,V4 完全跑在華為昇騰 950 PR 晶片上,不使用輝達 CUDA。在美國出口管制持續收緊的背景下,這不只是工程選擇,也是長期生存策略,而 DeepSeek 用 V4 給出了第一個規模化可用的版本。
数据状态✓ 已抓取全文阅读原文(動區 BlockTempo)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:a2ec06cd7e
来源:動區 BlockTempo
发布:2026-04-24 06:27:38
分类:zh_news · 导出分类 zh
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言