要聞列表騰訊全新的 Hy3 AI 模型是目前最有效率但鮮為人知的中國 LLM
Decrypt2026-04-23 17:18:08

騰訊全新的 Hy3 AI 模型是目前最有效率但鮮為人知的中國 LLM

ORIGINALTencent's New Hy3 AI Model Is the Most Efficient Chinese LLM No One's Talking About
AI 影響分析xAI Grok · medium 信賴度
TL;DR

方向中性騰訊發布高效能 Hy3 AI 模型,展現中國 AI 技術進展。

建議操作

觀望

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4978 字
簡介 - Hy3 preview 是一款擁有 2,950 億參數的 Mixture-of-Experts 模型,但每次運作僅需 210 億活躍參數,使其運行成本低於大多數同等能力的競爭對手。 - 在 SWE-bench Verified(一項測試真實 GitHub 錯誤修復的程式碼基準測試)中,其表現從 53% (Hy2) 躍升至 74.4%,較上一代提升了 40%。 - 該模型已在 Tencent 的應用生態系統中上線,包括 Yuanbao、QQ 和 Tencent Docs,Tencent Cloud 的 API 存取費用約為每百萬輸入 token 0.18 美元起。 Tencent 於週四悄然發布了其迄今為止最強大的 AI 模型,其基準測試數據令人無法忽視。Hy3 preview 是該公司在全面重建基礎設施後推出的首款模型,今日已在 GitHub、Hugging Face 和 ModelScope 上開源。 它也已在 Tencent Cloud 官方網站上架,提供付費方案。 Hy3 總共包含 2,950 億參數(衡量模型潛在知識廣度的指標),但在任何給定時間僅有 210 億參數處於活躍狀態。這正是 Mixture-of-Experts 架構的精妙之處——模型會將每個查詢路由至其「專家」子網路的特定子集,而不是一次運行所有參數。運算量更少、成本更低,且輸出品質大致相當。它還支援高達 256,000 個 token 的上下文,足以在單一提示詞中讀完一部長篇小說。 該模型的構建旨在平衡 Tencent 聲稱不再互相犧牲的三個要素:能力廣度、誠實評估和成本效益。其上一代旗艦模型 Hy2 擁有超過 4,000 億參數。Tencent 明確地調整了方向,認為 2,950 億是推理能力完全成熟,但增加更多參數已無法帶來顯著效益的最佳甜蜜點。 這並不意味著模型變差了。訓練更佳且參數較少的模型,經常能勝過規模更大的通用模型。 在程式設計方面,進步幅度巨大。SWE-bench Verified 是一項測試模型是否能真正修復 GitHub 儲存庫中真實錯誤的基準測試——這不是玩具問題,而是生產環境程式碼。Hy2 得分為 53.0%,Hy3 preview 得分為 74.4%。這是一代之內 40% 的飛躍,使其處於 Claude Opus 4.6 (80.8%) 的範圍內,並超越了 GLM-5 (77.8%) 和 Kimi-K2.5 (76.8%)。Terminal-Bench 2.0(衡量真實命令列環境中的自主任務執行能力)從 23.2% 提升至 54.4%,同樣是巨大的飛躍。 然而,對於構建 Agent 的開發者來說,該模型是一個非常有趣的選擇。Agent 擁有一套非常複雜的指令,涉及記憶、技能和工具呼叫。它們通常會遺漏某些環節,這可能會破壞工作流程或導致結果不佳。這就是為什麼隨著該領域成為業界最熱門的話題,Agent 能力對 AI 開發者變得越來越重要。這也是該模型立即在 Openclaw 上架的原因。 搜尋與瀏覽 Agent(模型必須在沒有人類指導的情況下從開放網路中檢索、篩選和合成資訊)的能力也大幅提升。在追蹤複雜網路研究任務的基準測試 BrowseComp 上,Hy3 preview 達到了 67.1%(高於 Hy2 的 28.7%)。在 WideSearch 上,它達到了 70.2%,超越了 GLM-5 和 Kimi-K2.5,但略遜於 Claude Opus 4.6 的 77.2%。 在推理方面,該模型在清華大學數學博士資格考試(2026 年春季)中超越了所有中國競爭對手,三次運行平均分 (avg@3) 為 88.4。這是真實世界的考試,而非經過篩選的資料集——Tencent 稱其優先考慮此類評估以避免基準測試作弊。該模型在 CHSBO 2025(中國全國高中生物奧林匹亞競賽)中也獲得了 87.8 分,是該類別中中國模型裡的最高分。 Hy3 preview 於 2026 年 1 月下旬開始訓練,並於
資料狀態✓ 已擷取全文閱讀原文(Decrypt)
🔍歷史類似事件· 關鍵字 + 標的比對6 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:889b3d4ce8
來源:Decrypt
發佈:2026-04-23 17:18:08
分類:一般 · 導出分類 neutral
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言