2026年6月10日,小米MiMo AI团队宣布开源MiMo Code V0.1.0,以MIT协议向全球开发者开放。这款AI编程工具的核心创新——四级记忆架构——直接解决了长期以来困扰所有AI编程助手的"长会话记忆丢失"问题。在超过200步的长周期编程任务中,MiMo Code的人类双盲测试胜率飙升至65%以上,成功超越了Claude Code。
传统AI编程助手面临的核心问题在于:无论模型本身的上下文窗口有多大(即使Claude Fable 5支持100万Token),在长时间、多步骤的编程任务中,模型不可避免地会"遗忘"早期的决策和上下文。小米团队给出的解决方案不是"更好的压缩算法",而是给AI装上了一套类似人类程序员的记忆系统。
MiMo Code的四级记忆架构基于SQLite FTS5全文搜索引擎驱动,包含四个层级:项目记忆(持久化MEMORY.md文件,记录项目级决策和背景)、会话检查点(当上下文接近填满时,独立的"检查点写入器"子代理自动生成结构化快照)、草稿笔记(临时思路和中间结果)、任务进度日志(记录当前任务完成情况和卡点)。
这套架构的精妙之处在于引入了"检查点写入器"这个专职子代理。传统方案是让主代理自己写总结,但主代理已经在处理复杂任务,再增加自我总结的负担反而会降低质量。MiMo Code的做法是让一个独立的子代理专门负责这项工作,实现了"关注点分离"——就像建筑工地上有专门的图纸管理员更新蓝图,工人只管施工。
小米技术博客公布的基准测试数据显示了MiMo Code的全面优势:在SWE-bench Verified上,MiMo Code + MiMo-V2.5-Pro得分82%,高于Claude Code + Sonnet 4.6的79%;在SWE-bench Pro上,62%对55%,领先7个百分点;在Terminal Bench 2上,73%对69%,领先4个百分点。
更关键的发现来自576名开发者参与的人类双盲测试(共计1213组对决样本):当任务步骤少于200步时,MiMo Code和Claude Code胜率持平;但超过200步后,MiMo Code胜率升至65%以上。这直接验证了记忆架构在长周期任务中的核心竞争力。
值得注意的是,当两台机器运行相同模型(MiMo-V2.5-Pro)时,MiMo Code框架本身在SWE-bench Pro和Terminal Bench 2上比Claude Code高出约5个百分点。小米方面坦诚地表示,框架本身是加分项而非模型优势,这种诚实态度在AI行业颇为罕见。
MiMo Code的定价策略极具侵略性。MiMo-V2.5定价为输入0.4美元/百万Token、输出2.0美元/百万Token;MiMo-V2.5-Pro为输入1.0美元、输出3.0美元;缓存命中时,输入成本再降至0.2-0.4美元/百万Token。这个价格是什么概念?小米官方公布的测试中,完成125项开发任务、消耗3.87亿Token,总API成本仅70美元。作为对比,用Claude Sonnet 4.6完成同样任务可能需要500美元以上。
框架本身还支持第三方后端——DeepSeek、Kimi、GLM以及任何兼容OpenAI API的服务都可以接入,意味着开发者不会被锁定在小米的生态里。
基于MiMo-ASR和TenVAD技术,MiMo Code还支持语音编程功能。开发者可以用自然语言口述编程指令,在双手离开键盘思考时尤其实用。项目由前DeepSeek R1核心成员罗福莉(米福莉)领导,自2025年4月发布MiMo-7B以来,小米已构建了包含视觉语言、Flash及Pro版本在内的完整模型矩阵。
从更大的格局来看,MiMo Code代表了小米在AI基础设施层面的战略投入。结合小米"人车家全生态"战略和2026年160亿元的AI投入计划,MiMo Code定位为小米AI生态的核心开发工具层,为手机端智能体、智能汽车、全屋智能等场景提供底层AI编程能力。这不仅是一款工具产品,更是AI时代"开发者入口"的争夺战中的重要布局。
补充分析:小米AI开源突击:MiMo Code终结编程"失忆症",长周期任务超越Claude Code所涉及的话题在2026年6月具有重要的产业意义。从行业发展的宏观视角来看,这一领域的技术进步和市场变化值得持续关注。综合多家行业媒体和分析机构的观点,该方向的发展潜力正在被越来越多的企业和投资者所认可。未来几个月内,随着更多技术和产品的发布,这一领域的竞争格局将进一步清晰,相关产业链上的企业也将在这一过程中找到各自的定位和增长机会。对于从业者和关注者来说,保持对这一动态变化的关注,将有助于更好地把握AI产业发展的脉搏。
发布时间:2026-06-25