要聞列表Nvidia 發布 Nemotron 3 Super,這是一款專為 Agentic Workloads 打造的 120B 開源 AI 模型
Bitcoin.com2026-04-20 02:30:44

Nvidia 發布 Nemotron 3 Super,這是一款專為 Agentic Workloads 打造的 120B 開源 AI 模型

ORIGINALNvidia Releases Nemotron 3 Super, a 120B Open AI Model Built for Agentic Workloads
AI 影響分析Grok 分析中...
📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4419 字
Nvidia 發布了 Nemotron 3 Super,這是一款總參數達 1200 億的開放式混合模型,旨在降低大規模運行人工智慧(AI)代理的運算成本。 Nvidia 發布 Nemotron 3 Super,一款專為代理工作負載打造的 120B 開放式 AI 模型 重點摘要: - Nvidia 發布了 Nemotron 3 Super,這是一款 120B 參數的開放式 MoE 模型,每次前向傳遞僅激活 127 億個參數。 - 在 8k 輸入/64k 輸出的設置下,Nemotron 3 Super 在代理工作負載中的吞吐量比 Qwen3.5-122B-A10B 高出達 7.5 倍。 - 該模型在 Nvidia Nemotron Open Model License 下完全開放,檢查點與訓練數據已上傳至 Hugging Face。 Nvidia 推出 Nemotron 3 Super,吞吐量較 Qwen3.5-122B 提升 7.5 倍 這款最新的 Nvidia 模型採用混合專家(MoE)架構,每次前向傳遞僅激活 127 億個參數,這意味著其大部分權重在推理過程中處於閒置狀態。該設計選擇直接針對開發者在部署多步驟 AI 代理時遇到的兩個問題:擴展推理鏈帶來的額外成本,以及在多代理管道中可能增加高達 15 倍的 Token 使用量。 Nemotron 3 Super 是 Nvidia Nemotron 3 系列中的第二款模型,繼 2025 年 12 月發布的 Nemotron 3 Nano 之後。Nvidia 於 2026 年 3 月 10 日左右宣布了此發布。 該模型在 88 層中使用了混合 Mamba-Transformer 主幹架構。Mamba-2 區塊以線性時間效率處理長序列,而 Transformer 注意力層則保留了精確的召回能力。這種組合使模型能夠原生支援高達 100 萬個 Token 的上下文窗口,且不會出現純注意力設計常見的記憶體損耗。 Nvidia 還內建了 LatentMoE 路由系統,在將 Token 嵌入發送到每層 512 個專家之前,先將其壓縮到低秩空間,每次激活 22 個專家。該公司表示,與標準 MoE 方法相比,這使得在相同的推理成本下專家數量增加了約四倍,並實現了更細緻的任務專業化,例如在專家層級將 Python 邏輯與 SQL 處理分開。 使用兩個共享權重頭的 Multi-Token Prediction 層加速了思維鏈生成,並允許原生推測解碼。在結構化任務上,Nvidia 報告生成速度提升了高達三倍。 該模型在兩個階段中對 25 兆個 Token 進行了預訓練。第一階段使用了 20 兆個廣泛數據 Token;第二階段使用了 5 兆個針對基準性能調整的高質量 Token。最後的擴展階段對 510 億個 Token 進行了訓練,將原生上下文擴展至 100 萬個 Token。後訓練包括對約 700 萬個樣本進行監督微調,以及在 21 個環境中進行超過 120 萬次推演的強化學習。 在基準測試中,Nemotron 3 Super 在 MMLU-Pro 上得分 83.73,在 AIME25 上得分 90.21,在使用 OpenHands 的 SWE-Bench 上得分 60.47。在 PinchBench 上,它達到了 85.6%,是同類開放模型中報告的最高分。在長上下文評估中,它在 RULER 1M 上得分 91.64。 與 GPT-OSS-120B 相比,Nemotron 3 Super 在 8k 輸入和 64k 輸出時的吞吐量是其 2.2 倍。與 Qwen3.5-122B-A10B 相比,該數字達到了 7.5 倍。Nvidia 還報告稱,與上一代 Nemotron Super 相比,吞吐量提升超過五倍,準確度提升高達兩倍。 Nvidia 使用其針對 Blackwell GPU 優化的 NVFP4 四位元浮點格式對模型進行了端到端訓練。Nvidia 表示,在 B200 硬體上,推理速度比 H100 上的 FP8 快
資料狀態✓ 已擷取全文閱讀原文(Bitcoin.com)
🔍歷史類似事件· 關鍵字 + 標的比對1 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:5e28767a39
來源:Bitcoin.com
發佈:2026-04-20 02:30:44
分類:一般 · 導出分類 neutral
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言
Nvidia 發布 Nemotron 3 Super,這是一款專為 Agentic Workloads 打造的 120B 開源 AI 模型 | Feel.Trading