小米新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型

📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯5703 字

简述 - Xiaomi 发布了 MiMo-V2.5 和 V2.5-Pro，将文本、图像、音频和视频能力整合到单一的多模态 AI 模型中。 - Pro 版本在编程和智能体基准测试中与顶级前沿模型不相上下，同时显著提升了 token 效率和成本表现。 - 这些新模型标志着 Xiaomi 在 AI 领域的快速推进，在 OpenRouter 等平台获得强劲采用之后，公司计划开源并积极迭代。 Xiaomi 又一次发布了全新的 AI 模型家族。几周前，该公司推出了 MiMo-V2-Pro——一款万亿参数模型，在 Xiaomi 揭晓其身份之前，它曾以"Hunter Alpha"为代号在 OpenRouter 上低调流传。它一夜之间从匿名跃升至顶级行列。我们测试过它，表现令人印象深刻。如今 Xiaomi 携 MiMo-V2.5 和 MiMo-V2.5-Pro 双模型家族回归，新增了上一代在单一产品中从未具备的能力：眼睛、耳朵以及处理视频的能力。哦，公司还计划在不久的将来开源这些模型。 V2-Pro 仅支持文本和代码。多模态能力存在于其姊妹模型 MiMo-V2-Omni 中，但那是一款独立产品，且基准测试分数较低。MiMo-V2.5 将所有这些整合进单一模型——更快、更强大，并从一开始就原生集成了图像、视频和音频理解能力。这对普通用户来说，比听起来更重要。例如，现在你可以上传一张冰箱照片，让它推荐晚餐食谱。丢入一段视频教程，获取分步摘要。录下一场会议，让它提取行动项。所有功能集于一处，无需在不同定价策略的独立工具和独立模型之间来回切换。 Xiaomi 声称 MiMo-V2.5-Pro 代表了"从 MiMo-V2-Pro 在通用智能体能力、复杂软件工程和长时程任务方面的重大飞跃"，并表示它现在在大多数编程和智能体基准测试中可与 Claude Opus 4.6 和 GPT-5.4 等前沿模型相媲美。这些数据基本支持了这一说法——但在更困难的推理任务上仍能看到一些差距。基础版和 Pro 版用途不同。MiMo-V2.5-Pro 是重型选手。Xiaomi 表示它能"自主完成涉及 1000 多次工具调用的专业任务，相当于人类专家数天的工作量"。这适用于运行复杂多步骤自动化工作流的开发者。它以每秒 60–80 token 的速度运行，每百万 token 输入 1.00 美元 / 输出 3.00 美元。 MiMo-V2.5 是日常版本。更快（每秒 100–150 token）、更便宜（输入 0.40 美元 / 输出 2.00 美元），并支持 Pro 独有版跳过的所有模态——图像、音频和视频。两款模型均配备 1M token 的上下文窗口，意味着它们可在单次对话中容纳约 75 万字。在 SWE-bench Pro 上——这是一项编程基准测试，模型需要修复真实初创公司代码库中的实际 bug，按通过率打分（满分 100）——MiMo-V2.5-Pro 解决了 57.2% 的任务。这接近该领域的顶尖水平；平均模型仅能达到约 25%。在 τ3-bench 和 ClawEval 上情况类似，它与 Claude Opus 4.6 和 GPT-5.4 仅相差几分。差距出现在 Humanity's Last Exam 上，这是一项涵盖数十个学术领域研究生级问题的严酷考验：MiMo 得分 48.0%，而 GPT-5.4 为 58.7%——10 分的差距难以掩饰。它真正脱颖而出的地方在于 token 效率。Xiaomi 表示，在同等基准分数下，MiMo-V2.5-Pro 比 Kimi K2.6 少用 42% 的 token，而 MiMo-V2.5 在类似结果下使用的 token 几乎只有 Muse Spark 的一半。对于任何大规模运行这些模型的人——每天处理数千请求的开发者来说——这种差异就是实打实的钱。在多模态任务上，MiMo-V2.5 的得分显示其表现与 GPT-5.4 和 Gemini 3.1 Pro 相当，并相当接近 Opus 4.6 的水准。自 2025 年 12 月以来，Xiaomi 已完成三次重大模型发布：首先发布了高效的 MiMo-V2-Flash，然后是 3 月的 V2-Pro/Omni/TTS 三件套，今天又发布了 V2.5 系列。该公司承诺未来三年至少投入 87 亿美元的 AI 投资，这是由 CEO Lei Jun 在 V2-Pro 发布次日宣布的——而发布节奏表明，这笔预算已经在动了。背景情况也有助于解释这种速度。根据 Digital Applied 的数据，截至 4 月初，Xiaomi 的模型占据 OpenRouter 所有流量的约 21%——过去 7 天增长超过 42%。当你的上一款模型成为全球最大 AI 路由平台上最具竞争力的模型之一时，你就同时拥有了资源和压力去快速迭代。这可能要归功于智能体 AI 工具 Hermes 的火爆，以及它与 Xiaomi 的合作安排，让用户在限定时间内免费使用 MiMo v2 Pro。该时限已经结束，但当时的热度足以让 Xiaomi 跻身赛场。如今想免费使用 Hermes 的用户可以通过 Nous API 测试新的 Step 3.5 flash，或使用 OpenRouter 的免费模型，但使用额度更受限。 Token 套餐定价也作了刷新。MiMo-V2.5 以 1 倍信用费率运行；MiMo-V2.5-Pro 为 2 倍。Xiaomi 不再对使用完整 100 万 token 上下文窗口收取额外倍率费用，这使得长文档分析的成本明显降低。现有用户还可获得完整的信用重置作为发布奖励。 Xiaomi 表示该模型已在其 AI Studio 中上线。我们在发布后立即尝试访问——未成功。不过，它已经通过 Xiaomi MiMo API 上线，这才是大多数开发者实际使用它的地方。该公司表示已在训练下一代模型，具备"更深入的推理、更紧密的工具集成和更丰富的现实世界落地能力"。以 Xiaomi 目前的推进速度，这个公告大概比你预想的要更近。

数据状态✓ 已抓取全文阅读原文（Decrypt）

🔍历史类似事件· 关键词 + 标的比对6 则

2026-04-30

Mistral AI 发布了新的开源模型。互联网对此反应平平，但有一点除外

相似度 180%關鍵字 new/model/one

2026-04-23

Tencent 的新款 Hy3 AI 模型是目前最被低估的高效 Chinese LLM

相似度 180%關鍵字 new/model/one

2026-04-18

OpenAI 的新 AI 模型 Rosalind 或能將藥物研發週期縮短數年，但你大概率無法使用它

相似度 180%關鍵字 new/model/can

2026-05-21

Nvidia 在創下歷史新高後，能否延續其由 AI 推動的漲勢？

相似度 150%關鍵字 new/all/can

2026-04-29

Aptos 表示其新的隐私币旨在解决加密货币领域最大的权衡难题之一

相似度 130%關鍵字 new/one

2026-04-29

BlackRock 的 Bitcoin 期權可能會推動創下歷史新高：專家

相似度 130%關鍵字 new/all

💡 目前用关键词 + 标的比对（MVP）· 之后会升级为 embedding 语义搜寻

原始信息

ID：ca63fe28aa

来源：Decrypt

发布：2026-04-22 19:42:35

分类：一般 · 导出分类 neutral

标的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言