要闻列表小米新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型
Decrypt2026-04-22 19:42:35

小米新款 MiMo 2.5 Pro AI 能看、能聽、能行動——全整合於單一模型

ORIGINALXiaomi's New MiMo 2.5 Pro AI Can See, Hear, and Act—All in One Model
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯5703 字
简述 - Xiaomi 发布了 MiMo-V2.5 和 V2.5-Pro,将文本、图像、音频和视频能力整合到单一的多模态 AI 模型中。 - Pro 版本在编程和智能体基准测试中与顶级前沿模型不相上下,同时显著提升了 token 效率和成本表现。 - 这些新模型标志着 Xiaomi 在 AI 领域的快速推进,在 OpenRouter 等平台获得强劲采用之后,公司计划开源并积极迭代。 Xiaomi 又一次发布了全新的 AI 模型家族。 几周前,该公司推出了 MiMo-V2-Pro——一款万亿参数模型,在 Xiaomi 揭晓其身份之前,它曾以"Hunter Alpha"为代号在 OpenRouter 上低调流传。它一夜之间从匿名跃升至顶级行列。我们测试过它,表现令人印象深刻。 如今 Xiaomi 携 MiMo-V2.5 和 MiMo-V2.5-Pro 双模型家族回归,新增了上一代在单一产品中从未具备的能力:眼睛、耳朵以及处理视频的能力。哦,公司还计划在不久的将来开源这些模型。 V2-Pro 仅支持文本和代码。多模态能力存在于其姊妹模型 MiMo-V2-Omni 中,但那是一款独立产品,且基准测试分数较低。MiMo-V2.5 将所有这些整合进单一模型——更快、更强大,并从一开始就原生集成了图像、视频和音频理解能力。 这对普通用户来说,比听起来更重要。例如,现在你可以上传一张冰箱照片,让它推荐晚餐食谱。丢入一段视频教程,获取分步摘要。录下一场会议,让它提取行动项。所有功能集于一处,无需在不同定价策略的独立工具和独立模型之间来回切换。 Xiaomi 声称 MiMo-V2.5-Pro 代表了"从 MiMo-V2-Pro 在通用智能体能力、复杂软件工程和长时程任务方面的重大飞跃",并表示它现在在大多数编程和智能体基准测试中可与 Claude Opus 4.6 和 GPT-5.4 等前沿模型相媲美。这些数据基本支持了这一说法——但在更困难的推理任务上仍能看到一些差距。 基础版和 Pro 版用途不同。MiMo-V2.5-Pro 是重型选手。Xiaomi 表示它能"自主完成涉及 1000 多次工具调用的专业任务,相当于人类专家数天的工作量"。这适用于运行复杂多步骤自动化工作流的开发者。它以每秒 60–80 token 的速度运行,每百万 token 输入 1.00 美元 / 输出 3.00 美元。 MiMo-V2.5 是日常版本。更快(每秒 100–150 token)、更便宜(输入 0.40 美元 / 输出 2.00 美元),并支持 Pro 独有版跳过的所有模态——图像、音频和视频。两款模型均配备 1M token 的上下文窗口,意味着它们可在单次对话中容纳约 75 万字。 在 SWE-bench Pro 上——这是一项编程基准测试,模型需要修复真实初创公司代码库中的实际 bug,按通过率打分(满分 100)——MiMo-V2.5-Pro 解决了 57.2% 的任务。这接近该领域的顶尖水平;平均模型仅能达到约 25%。在 τ3-bench 和 ClawEval 上情况类似,它与 Claude Opus 4.6 和 GPT-5.4 仅相差几分。差距出现在 Humanity's Last Exam 上,这是一项涵盖数十个学术领域研究生级问题的严酷考验:MiMo 得分 48.0%,而 GPT-5.4 为 58.7%——10 分的差距难以掩饰。 它真正脱颖而出的地方在于 token 效率。Xiaomi 表示,在同等基准分数下,MiMo-V2.5-Pro 比 Kimi K2.6 少用 42% 的 token,而 MiMo-V2.5 在类似结果下使用的 token 几乎只有 Muse Spark 的一半。对于任何大规模运行这些模型的人——每天处理数千请求的开发者来说——这种差异就是实打实的钱。 在多模态任务上,MiMo-V2.5 的得分显示其表现与 GPT-5.4 和 Gemini 3.1 Pro 相当,并相当接近 Opus 4.6 的水准。 自 2025 年 12 月以来,Xiaomi 已完成三次重大模型发布:首先发布了高效的 MiMo-V2-Flash,然后是 3 月的 V2-Pro/Omni/TTS 三件套,今天又发布了 V2.5 系列。该公司承诺未来三年至少投入 87 亿美元的 AI 投资,这是由 CEO Lei Jun 在 V2-Pro 发布次日宣布的——而发布节奏表明,这笔预算已经在动了。 背景情况也有助于解释这种速度。根据 Digital Applied 的数据,截至 4 月初,Xiaomi 的模型占据 OpenRouter 所有流量的约 21%——过去 7 天增长超过 42%。当你的上一款模型成为全球最大 AI 路由平台上最具竞争力的模型之一时,你就同时拥有了资源和压力去快速迭代。 这可能要归功于智能体 AI 工具 Hermes 的火爆,以及它与 Xiaomi 的合作安排,让用户在限定时间内免费使用 MiMo v2 Pro。该时限已经结束,但当时的热度足以让 Xiaomi 跻身赛场。 如今想免费使用 Hermes 的用户可以通过 Nous API 测试新的 Step 3.5 flash,或使用 OpenRouter 的免费模型,但使用额度更受限。 Token 套餐定价也作了刷新。MiMo-V2.5 以 1 倍信用费率运行;MiMo-V2.5-Pro 为 2 倍。Xiaomi 不再对使用完整 100 万 token 上下文窗口收取额外倍率费用,这使得长文档分析的成本明显降低。现有用户还可获得完整的信用重置作为发布奖励。 Xiaomi 表示该模型已在其 AI Studio 中上线。我们在发布后立即尝试访问——未成功。不过,它已经通过 Xiaomi MiMo API 上线,这才是大多数开发者实际使用它的地方。 该公司表示已在训练下一代模型,具备"更深入的推理、更紧密的工具集成和更丰富的现实世界落地能力"。以 Xiaomi 目前的推进速度,这个公告大概比你预想的要更近。
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:ca63fe28aa
来源:Decrypt
发布:2026-04-22 19:42:35
分类:一般 · 导出分类 neutral
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言