小米迄今最强大模型 Xiaomi MiMo-V2.5 系列开启公测
发布日期:2026-04-30 18:27 点击次数:64
IT之家从公告获悉,XiaomiMiMo-V2.5系列包含MiMo-V2.5、V2.5-Pro、V2.5-TTSSeries、V2.5-ASR,拥有更强的推理、更稳的Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模态感知和理解。与此同时,小米也对TokenPlan定价方案进行了优化。

MiMo-V2.5-Pro:更强的智能体,更长的专注力
据介绍,MiMo-V2.5-Pro是小米迄今最强大的模型。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖Agent模型(ClaudeOpus4.6、GPT-5.4)正面较量,相较上一代MiMo-V2-Pro实现了全方位跃升。
内部测试中,MiMo-V2.5-Pro搭配合适的运行框架,它可以稳定完成单次涉及近千轮工具调用的长程任务,在智能体场景下的指令遵循能力也明显提升——既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。至此,MiMo-V2.5-Pro已经可以以更高的置信度承担起真正严肃的专业工作。

MiMo-V2.5-Pro为更高难、更复杂的任务目标而生。小米把那些需要人类专家数天、乃至数周才能完成的任务交给它,让它独立跑完长程,且仍然可以保持极高质量。以下是它交付的结果:
用Rust实现完整的SysY编译器
该任务源自北京大学《编译原理》课程项目,要求模型用Rust从零实现一个完整的SysY编译器:词法分析器、语法分析器、AST、KoopaIR代码生成、RISC-V汇编后端,以及性能优化。作为参考,北大本科生完成该项目通常需要数周时间,然而MiMo-V2.5-Pro用时仅4.3小时、经过672次工具调用完成全部工作,在隐藏测试集上取得233/233的满分,展现了极高效的生产力价值。

它没有陷入反复试错的蛮力,而是逐层搭建整个编译器:先搭完整流水线骨架,再逐层攻克——KoopaIR满分(110/110),RISC-V后端满分(103/103),性能优化满分(20/20)。首次编译即通过137/233,59%的冷启动通过率,意味着在跑任何测试之前,架构就已经是对的了。第512轮,一次重构令lv9/riscv回退了两个测试点;模型自行诊断、恢复、继续推进。
开发一个视频编辑器
仅凭几句简单指令——"构建一个视频编辑器Web应用"——MiMo-V2.5-Pro便交付了一款可运行的Web应用:具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。最终构建的代码量达8,192行,历经1,868次工具调用,在11.5小时的自主工作中完成。
MiMo-V2.5:越级全模态Agent,百万上下文
MiMo-V2.5是为Agent场景而生的原生全模态大模型,能同时看、听、读,并把理解转化为行动。这一次,MiMo-V2.5带来个关键升级:
Agent能力全面超越MiMo-V2-Pro
在Claw-Eval等权威Agent评测中,MiMo-V2.5超过MiMo-V2-Pro水平,胜任日常简单任务,同时API成本降低约50%。
多模态感知全面超越MiMo-V2-Omni
跨模态推理、视频理解、图表分析等能力提升,在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源模型。

MiMo-V2.5全系列:更高Token效率
MiMo-V2.5全系列针对Token效率进行优化,用更少的Token做更多的事。
在达到相同Agent基准榜单ClawEval分数情况下:
MiMo-V2.5-Pro相比KimiK2.6节省了42%Token
MiMo-V2.5相比MuseSpark节省了50%Token

MiMo-V2.5全系列:如何搭配使用?
MiMo-V2.5-Pro专为长难Agent任务打造,MiMo-V2.5覆盖绝大多数通用Agent场景
MiMo-V2.5支持原生全模态Agent能力,涵盖图像、音频与视频
MiMo-V2.5具备更高的平均推理速度,可以更迅速地响应对时延敏感的任务

TokenPlan焕新升级
我们针对TokenPlan做了几项适合你的、实质性的优化:
Credits速率更新,更优惠
MiMo-V2.5:1x(消耗1Token=1Credit)
MiMo-V2.5-Pro:2x(消耗1Token=2Credits)
取消1Token=4Credits计费方式,从现在起,TokenPlan不再区分256k和1M上下文窗口的Credit倍率。
夜间专属优惠速率
北京时间每天00:00~08:00,所有模型Credits消耗速率在原有基础上再打8折。
自动续费享折扣
新增「连续包月」订阅模式,老用户开通自动续费享次月7折,新用户享次月77折,均限一次。
上线福利:TokenPlan用户Credits全量重置
所有已购买TokenPlan用户(截至北京时间4月22日22:00前)的Credits额度将全部重置清零,重新开始计算。

参考