騰訊全新的 Hy3 AI 模型是目前最有效率但鮮為人知的中國 LLM

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4978 字

簡介 - Hy3 preview 是一款擁有 2,950 億參數的 Mixture-of-Experts 模型，但每次運作僅需 210 億活躍參數，使其運行成本低於大多數同等能力的競爭對手。 - 在 SWE-bench Verified（一項測試真實 GitHub 錯誤修復的程式碼基準測試）中，其表現從 53% (Hy2) 躍升至 74.4%，較上一代提升了 40%。 - 該模型已在 Tencent 的應用生態系統中上線，包括 Yuanbao、QQ 和 Tencent Docs，Tencent Cloud 的 API 存取費用約為每百萬輸入 token 0.18 美元起。 Tencent 於週四悄然發布了其迄今為止最強大的 AI 模型，其基準測試數據令人無法忽視。Hy3 preview 是該公司在全面重建基礎設施後推出的首款模型，今日已在 GitHub、Hugging Face 和 ModelScope 上開源。它也已在 Tencent Cloud 官方網站上架，提供付費方案。 Hy3 總共包含 2,950 億參數（衡量模型潛在知識廣度的指標），但在任何給定時間僅有 210 億參數處於活躍狀態。這正是 Mixture-of-Experts 架構的精妙之處——模型會將每個查詢路由至其「專家」子網路的特定子集，而不是一次運行所有參數。運算量更少、成本更低，且輸出品質大致相當。它還支援高達 256,000 個 token 的上下文，足以在單一提示詞中讀完一部長篇小說。該模型的構建旨在平衡 Tencent 聲稱不再互相犧牲的三個要素：能力廣度、誠實評估和成本效益。其上一代旗艦模型 Hy2 擁有超過 4,000 億參數。Tencent 明確地調整了方向，認為 2,950 億是推理能力完全成熟，但增加更多參數已無法帶來顯著效益的最佳甜蜜點。這並不意味著模型變差了。訓練更佳且參數較少的模型，經常能勝過規模更大的通用模型。在程式設計方面，進步幅度巨大。SWE-bench Verified 是一項測試模型是否能真正修復 GitHub 儲存庫中真實錯誤的基準測試——這不是玩具問題，而是生產環境程式碼。Hy2 得分為 53.0%，Hy3 preview 得分為 74.4%。這是一代之內 40% 的飛躍，使其處於 Claude Opus 4.6 (80.8%) 的範圍內，並超越了 GLM-5 (77.8%) 和 Kimi-K2.5 (76.8%)。Terminal-Bench 2.0（衡量真實命令列環境中的自主任務執行能力）從 23.2% 提升至 54.4%，同樣是巨大的飛躍。然而，對於構建 Agent 的開發者來說，該模型是一個非常有趣的選擇。Agent 擁有一套非常複雜的指令，涉及記憶、技能和工具呼叫。它們通常會遺漏某些環節，這可能會破壞工作流程或導致結果不佳。這就是為什麼隨著該領域成為業界最熱門的話題，Agent 能力對 AI 開發者變得越來越重要。這也是該模型立即在 Openclaw 上架的原因。搜尋與瀏覽 Agent（模型必須在沒有人類指導的情況下從開放網路中檢索、篩選和合成資訊）的能力也大幅提升。在追蹤複雜網路研究任務的基準測試 BrowseComp 上，Hy3 preview 達到了 67.1%（高於 Hy2 的 28.7%）。在 WideSearch 上，它達到了 70.2%，超越了 GLM-5 和 Kimi-K2.5，但略遜於 Claude Opus 4.6 的 77.2%。在推理方面，該模型在清華大學數學博士資格考試（2026 年春季）中超越了所有中國競爭對手，三次運行平均分 (avg@3) 為 88.4。這是真實世界的考試，而非經過篩選的資料集——Tencent 稱其優先考慮此類評估以避免基準測試作弊。該模型在 CHSBO 2025（中國全國高中生物奧林匹亞競賽）中也獲得了 87.8 分，是該類別中中國模型裡的最高分。 Hy3 preview 於 2026 年 1 月下旬開始訓練，並於

資料狀態✓ 已擷取全文閱讀原文（Decrypt）

🔍歷史類似事件· 關鍵字 + 標的比對6 則

2026-04-30

Mistral AI 發布全新開源模型。網際網路反應冷淡，唯獨一點除外

相似度 180%關鍵字 new/model/one

2026-04-22

Xiaomi 的新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型中

相似度 180%關鍵字 new/model/one

2026-04-30

Elon Musk 表示大多數加密貨幣都是騙局，但 X 推出了新的加密貨幣交易終端

相似度 130%關鍵字 new/most

2026-04-30

OpenAI 終於解釋了為什麼 ChatGPT 一直談論 Goblins

相似度 130%關鍵字 talking/about

2026-04-29

專家分享關於 XRP 最該銘記在心的一件事

相似度 130%關鍵字 most/about

2026-04-29

Aptos 表示其新款隱私幣旨在解決加密貨幣領域最大的權衡難題之一

相似度 130%關鍵字 new/one

💡 目前用關鍵字 + 標的比對（MVP）· 之後會升級為 embedding 語意搜尋

原始資訊

ID：889b3d4ce8

來源：Decrypt

發佈：2026-04-23 17:18:08

分類：一般 · 導出分類 neutral

標的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言