Xiaomi 的新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型中

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯5703 字

簡要重點 - Xiaomi 推出 MiMo-V2.5 與 V2.5-Pro，將文字、圖像、音訊與影片能力整合於單一多模態 AI 模型中。 - Pro 版本在程式編寫與 agentic 基準測試上可與頂尖前沿模型匹敵，同時大幅提升 token 效率與成本表現。 - 新模型標誌著 Xiaomi 在 AI 領域的快速布局，公司計劃開源，並在 OpenRouter 等平台獲得強勁採用後持續積極迭代。 Xiaomi 又一次推出全新的 AI 模型家族。幾週前，該公司發布了 MiMo-V2-Pro——一個一兆參數的模型，在 Xiaomi 公布其身分之前，曾以「Hunter Alpha」的代號低調地在 OpenRouter 上流傳。它一夕之間從匿名躍升至頂尖之列。我們測試過，相當令人印象深刻。如今 Xiaomi 帶著 MiMo-V2.5 與 MiMo-V2.5-Pro 回歸，這個雙模型家族在單一套件中加入了上一代從未具備的能力：眼睛、耳朵，以及處理影片的能力。哦，公司也計劃在不久的將來將模型開源。 V2-Pro 僅支援文字與程式碼。多模態能力存在於其姊妹模型 MiMo-V2-Omni 中，但那是另一個獨立產品，基準測試分數較低。MiMo-V2.5 將所有這些整合進一個模型——更快、更強大，並從一開始就內建原生的圖像、影片與音訊理解能力。這對一般使用者而言，比聽起來更重要。舉例來說，現在你可以上傳一張冰箱的照片，請它建議晚餐食譜；丟入一支教學影片，獲得逐步摘要；錄下一場會議，讓它擷取出待辦事項。全部在一個地方完成，不必在不同工具與採用不同定價策略的不同模型之間切換。 Xiaomi 聲稱 MiMo-V2.5-Pro 代表「相較於 MiMo-V2-Pro，在一般 agentic 能力、複雜軟體工程以及長時程任務上的重大躍進」，並表示它在大多數程式編寫與 agent 基準測試中，已能與 Claude Opus 4.6 和 GPT-5.4 等前沿模型匹敵。數據大致支持這個說法——但在較困難的推理任務上仍可見一些差距。基礎版與 Pro 版服務於不同用途。MiMo-V2.5-Pro 是重量級主力。Xiaomi 表示它能「自主完成涉及 1,000 個以上工具呼叫的專業任務，這些工作即便由人類專家處理也需要數天時間」。這是為了開發者執行複雜、多步驟的自動化工作流程而設計。其速度為每秒 60–80 個 token，每百萬 token 的費用為輸入 $1.00、輸出 $3.00。 MiMo-V2.5 則是日常版本。更快（每秒 100–150 個 token）、更便宜（輸入 $0.40、輸出 $2.00），並支援所有模態——包括 Pro 版才略過的圖像、音訊與影片。兩個模型皆具備 1M token 的上下文窗口，意味著它們能在單一對話中容納約 750,000 字。在 SWE-bench Pro 上——一個讓模型修復真實新創公司程式碼庫中實際 bug 的程式編寫基準，以通過率 0 至 100 計分——MiMo-V2.5-Pro 解決了 57.2% 的任務。這已接近領域頂端；平均模型約為 25%。在 τ3-bench 與 ClawEval 上情況類似，其表現與 Claude Opus 4.6 和 GPT-5.4 僅相差數個百分點。差距出現在 Humanity's Last Exam，這是一個涵蓋數十個學術領域研究所程度問題的考驗：MiMo 得分 48.0%，而 GPT-5.4 為 58.7——這 10 個百分點的落差難以掩飾。它真正出色之處在於 token 效率。Xiaomi 表示，在基準測試分數相當的情況下，MiMo-V2.5-Pro 使用的 token 比 Kimi K2.6 少 42%，而 MiMo-V2.5 在相似結果下使用的 token 幾乎僅為 Muse Spark 的一半。對於任何大規模運行這些模型的人——每天處理數千個請求的開發者——這個差異就是實實在在的金錢。在多模態任務上，MiMo-V2.5 的分數顯示其表現可與 GPT/5.4 和 Gemini 3.1 Pro 相當，並非常接近 Opus 4.6 的水準。自 2025 年 12 月以來，Xiaomi 已完成三次重大模型發布：首先是高效率的 MiMo-V2-Flash，接著是 3 月的 V2-Pro/Omni/TTS 三件套，然後是今天的 V2.5 系列。公司承諾在未來三年至少投入 87 億美元於 AI，這項投資是由 CEO Lei Jun 在 V2-Pro 發布後一天宣布的——而發布節奏顯示這筆預算已經開始流動。背景也有助於解釋這樣的速度。根據 Digital Applied 的資料，截至 4 月初，Xiaomi 的模型約佔 OpenRouter 上所有流量的 21%——並在過去 7 天內成長超過 42%。當你的上一個模型已成為全球最大 AI 路由平台上最具競爭力的模型之一時，你既有資源也有壓力快速迭代。這很可能要歸功於 agentic AI 工具 Hermes 的爆紅，以及它與 Xiaomi 的合作安排，讓使用者能在限定時間內免費使用 MiMo v2 Pro。該時段現已結束，但這波熱潮足以讓 Xiaomi 站上競技舞台。想要免費使用 Hermes 的人，現在可以透過 Nous API 試用全新的 Step 3.5 flash，或使用 OpenRouter 上的免費模型，但用量會比較受限。 Token 方案的定價也有更新。MiMo-V2.5 以 1 倍信用點數費率運行，MiMo-V2.5-Pro 則為 2 倍。Xiaomi 不再對使用完整的 100 萬 token 上下文窗口加收額外倍數，這讓長文件分析的成本明顯降低。現有使用者也可獲得完整的信用點數重置作為發布獎勵。 Xiaomi 表示該模型已在其 AI Studio 上線。我們在發布後立即嘗試於該處存取——未能成功。不過，它已可透過 Xiaomi MiMo API 使用，這也是大多數開發者實際使用的地方。公司表示已在訓練下一代模型，將具備「更深層的推理、更緊密的工具整合，以及更豐富的真實世界基礎」。以 Xiaomi 目前的推進速度，那則公告或許會比你預期的更快到來。

資料狀態✓ 已擷取全文閱讀原文（Decrypt）

🔍歷史類似事件· 關鍵字 + 標的比對6 則

2026-04-30

Mistral AI 發布全新開源模型。網際網路反應冷淡，唯獨一點除外

相似度 180%關鍵字 new/model/one

2026-04-23

騰訊全新的 Hy3 AI 模型是目前最有效率但鮮為人知的中國 LLM

相似度 180%關鍵字 new/model/one

2026-04-18

OpenAI 的新 AI 模型 Rosalind 可能會讓藥物研發縮短數年。你大概無法使用它

相似度 180%關鍵字 new/model/can

2026-05-29

Ripple 取得 Fed 主帳戶批准能否引爆 XRP 新一輪牛市？AI 模型表示 80 美元有望實現

相似度 150%關鍵字 new/model/can

2026-05-21

Nvidia 在創下歷史新高後，能否延續其由 AI 推動的漲勢？

相似度 150%關鍵字 new/all/can

2026-04-29

Aptos 表示其新款隱私幣旨在解決加密貨幣領域最大的權衡難題之一

相似度 130%關鍵字 new/one

💡 目前用關鍵字 + 標的比對（MVP）· 之後會升級為 embedding 語意搜尋

原始資訊

ID：ca63fe28aa

來源：Decrypt

發佈：2026-04-22 19:42:35

分類：一般 · 導出分類 neutral

標的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言