要聞列表Xiaomi 的新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型中
Decrypt2026-04-22 19:42:35

Xiaomi 的新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型中

ORIGINALXiaomi's New MiMo 2.5 Pro AI Can See, Hear, and Act—All in One Model
AI 影響分析xAI Grok · medium 信賴度
TL;DR

方向中性小米發布多模態 AI 模型 MiMo 2.5 Pro。

建議操作

觀望

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯5703 字
簡要重點 - Xiaomi 推出 MiMo-V2.5 與 V2.5-Pro,將文字、圖像、音訊與影片能力整合於單一多模態 AI 模型中。 - Pro 版本在程式編寫與 agentic 基準測試上可與頂尖前沿模型匹敵,同時大幅提升 token 效率與成本表現。 - 新模型標誌著 Xiaomi 在 AI 領域的快速布局,公司計劃開源,並在 OpenRouter 等平台獲得強勁採用後持續積極迭代。 Xiaomi 又一次推出全新的 AI 模型家族。 幾週前,該公司發布了 MiMo-V2-Pro——一個一兆參數的模型,在 Xiaomi 公布其身分之前,曾以「Hunter Alpha」的代號低調地在 OpenRouter 上流傳。它一夕之間從匿名躍升至頂尖之列。我們測試過,相當令人印象深刻。 如今 Xiaomi 帶著 MiMo-V2.5 與 MiMo-V2.5-Pro 回歸,這個雙模型家族在單一套件中加入了上一代從未具備的能力:眼睛、耳朵,以及處理影片的能力。哦,公司也計劃在不久的將來將模型開源。 V2-Pro 僅支援文字與程式碼。多模態能力存在於其姊妹模型 MiMo-V2-Omni 中,但那是另一個獨立產品,基準測試分數較低。MiMo-V2.5 將所有這些整合進一個模型——更快、更強大,並從一開始就內建原生的圖像、影片與音訊理解能力。 這對一般使用者而言,比聽起來更重要。舉例來說,現在你可以上傳一張冰箱的照片,請它建議晚餐食譜;丟入一支教學影片,獲得逐步摘要;錄下一場會議,讓它擷取出待辦事項。全部在一個地方完成,不必在不同工具與採用不同定價策略的不同模型之間切換。 Xiaomi 聲稱 MiMo-V2.5-Pro 代表「相較於 MiMo-V2-Pro,在一般 agentic 能力、複雜軟體工程以及長時程任務上的重大躍進」,並表示它在大多數程式編寫與 agent 基準測試中,已能與 Claude Opus 4.6 和 GPT-5.4 等前沿模型匹敵。數據大致支持這個說法——但在較困難的推理任務上仍可見一些差距。 基礎版與 Pro 版服務於不同用途。MiMo-V2.5-Pro 是重量級主力。Xiaomi 表示它能「自主完成涉及 1,000 個以上工具呼叫的專業任務,這些工作即便由人類專家處理也需要數天時間」。這是為了開發者執行複雜、多步驟的自動化工作流程而設計。其速度為每秒 60–80 個 token,每百萬 token 的費用為輸入 $1.00、輸出 $3.00。 MiMo-V2.5 則是日常版本。更快(每秒 100–150 個 token)、更便宜(輸入 $0.40、輸出 $2.00),並支援所有模態——包括 Pro 版才略過的圖像、音訊與影片。兩個模型皆具備 1M token 的上下文窗口,意味著它們能在單一對話中容納約 750,000 字。 在 SWE-bench Pro 上——一個讓模型修復真實新創公司程式碼庫中實際 bug 的程式編寫基準,以通過率 0 至 100 計分——MiMo-V2.5-Pro 解決了 57.2% 的任務。這已接近領域頂端;平均模型約為 25%。在 τ3-bench 與 ClawEval 上情況類似,其表現與 Claude Opus 4.6 和 GPT-5.4 僅相差數個百分點。差距出現在 Humanity's Last Exam,這是一個涵蓋數十個學術領域研究所程度問題的考驗:MiMo 得分 48.0%,而 GPT-5.4 為 58.7——這 10 個百分點的落差難以掩飾。 它真正出色之處在於 token 效率。Xiaomi 表示,在基準測試分數相當的情況下,MiMo-V2.5-Pro 使用的 token 比 Kimi K2.6 少 42%,而 MiMo-V2.5 在相似結果下使用的 token 幾乎僅為 Muse Spark 的一半。對於任何大規模運行這些模型的人——每天處理數千個請求的開發者——這個差異就是實實在在的金錢。 在多模態任務上,MiMo-V2.5 的分數顯示其表現可與 GPT/5.4 和 Gemini 3.1 Pro 相當,並非常接近 Opus 4.6 的水準。 自 2025 年 12 月以來,Xiaomi 已完成三次重大模型發布:首先是高效率的 MiMo-V2-Flash,接著是 3 月的 V2-Pro/Omni/TTS 三件套,然後是今天的 V2.5 系列。公司承諾在未來三年至少投入 87 億美元於 AI,這項投資是由 CEO Lei Jun 在 V2-Pro 發布後一天宣布的——而發布節奏顯示這筆預算已經開始流動。 背景也有助於解釋這樣的速度。根據 Digital Applied 的資料,截至 4 月初,Xiaomi 的模型約佔 OpenRouter 上所有流量的 21%——並在過去 7 天內成長超過 42%。當你的上一個模型已成為全球最大 AI 路由平台上最具競爭力的模型之一時,你既有資源也有壓力快速迭代。 這很可能要歸功於 agentic AI 工具 Hermes 的爆紅,以及它與 Xiaomi 的合作安排,讓使用者能在限定時間內免費使用 MiMo v2 Pro。該時段現已結束,但這波熱潮足以讓 Xiaomi 站上競技舞台。 想要免費使用 Hermes 的人,現在可以透過 Nous API 試用全新的 Step 3.5 flash,或使用 OpenRouter 上的免費模型,但用量會比較受限。 Token 方案的定價也有更新。MiMo-V2.5 以 1 倍信用點數費率運行,MiMo-V2.5-Pro 則為 2 倍。Xiaomi 不再對使用完整的 100 萬 token 上下文窗口加收額外倍數,這讓長文件分析的成本明顯降低。現有使用者也可獲得完整的信用點數重置作為發布獎勵。 Xiaomi 表示該模型已在其 AI Studio 上線。我們在發布後立即嘗試於該處存取——未能成功。不過,它已可透過 Xiaomi MiMo API 使用,這也是大多數開發者實際使用的地方。 公司表示已在訓練下一代模型,將具備「更深層的推理、更緊密的工具整合,以及更豐富的真實世界基礎」。以 Xiaomi 目前的推進速度,那則公告或許會比你預期的更快到來。
資料狀態✓ 已擷取全文閱讀原文(Decrypt)
🔍歷史類似事件· 關鍵字 + 標的比對6 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:ca63fe28aa
來源:Decrypt
發佈:2026-04-22 19:42:35
分類:一般 · 導出分類 neutral
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言