当前位置: 网站首页 >AI教程资讯 >正文

Xiaomi MiMo – 小米开源的首个推理大模型

来源:爱论文 时间:2025-05-14 09:42:44

Xiaomi MiMo是什么

Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采用创新的强化学习算法,显著提升数学推理和代码生成能力。MiMo 仅用 7B 参数规模,在公开测评集上超越 OpenAI 的 o1-mini 和阿里 Qwen 的 QwQ-32B-Preview 等更大规模模型。Xiaomi MiMo包含4 个模型版本,预训练模型MiMo-7B-Base、监督微调模型MiMo-7B-SFT、强化学习模型MiMo-7B-RL和MiMo-7B-RL-Zero已开源至 HuggingFace,为开发者提供强大的推理工具。

Xiaomi MiMo的主要功能

强大的数学推理能力:解决复杂的数学问题,提供准确的推理路径和答案。高效的代码生成能力:生成高质量的代码,适用于多种编程任务。优化的推理性能:基于预训练和后训练的联动提升推理能力,用 7B 参数规模超越更大规模的模型,展现出高效的推理性能。

Xiaomi MiMo的技术原理

预训练阶段:着重挖掘富推理语料,合成约 200B tokens 的推理数据,确保模型见过更多推理模式。基于三阶段训练,逐步提升训练难度,总训练量达到 25T tokens,模型在不同难度的任务中逐步提升能力。后训练阶段:强化学习算法:推出 Test Difficulty Driven Reward 算法,缓解困难算法问题中的奖励稀疏问题,提升模型在复杂任务中的表现。数据重采样策略:引入 Easy Data Re-Sampling 策略,稳定强化学习(RL)训练过程。高效训练框架:设计 Seamless Rollout 系统,加速 RL 训练(2.29 倍)和验证(1.96 倍),提升训练效率。模型架构优化:针对推理任务优化模型架构,确保在有限参数规模下实现高效推理能力。

Xiaomi MiMo的项目地址

GitHub仓库:https://github.com/XiaomiMiMoHuggingFace模型库:https://huggingface.co/XiaomiMiMo技术论文:https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

Xiaomi MiMo的应用场景

教育领域:辅助数学解题和编程学习,提供解题步骤和代码示例。科研与学术:协助逻辑推理和算法开发,帮助验证假设和设计实验。软件开发:生成和优化代码,辅助代码调试和问题解决。智能客服:解答复杂问题,提升问答系统效率。游戏娱乐:提供策略建议和智力谜题解答,增加游戏趣味性。
上一篇:F-Lite – Freepik联合FAL开源的文生图模型
相关资讯 更多+
  • Xiaomi MiMo – 小米开源的首个推理大模型
    Xiaomi MiMo – 小米开源的首个推理大模型

    Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采用创新的强化学习算法,显著提升数学推理和代码生成能力。

    AI教程资讯 2023-04-14

  • F-Lite – Freepik联合FAL开源的文生图模型
    F-Lite – Freepik联合FAL开源的文生图模型

    F-Lite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。F-Lite将T5-XXL作为文本编码器,基于抽取第17层特征注入到DiT模型中。

    AI教程资讯 2023-04-14

  • ACI.dev – 为AI智能体设计的开源MCP基础设施平台
    ACI.dev – 为AI智能体设计的开源MCP基础设施平台

    ACI dev 是开源的基础设施平台,专为 AI 智能体设计,提供强大的工具调用支持。集成了 600 多种预构建工具,涵盖 Gmail、Slack、Notion 等常见应用,支持通过函数调用或 MCP 服务器灵活访问。

    AI教程资讯 2023-04-14

  • URM – 阿里妈妈推出的世界知识大模型
    URM – 阿里妈妈推出的世界知识大模型

    URM(Universal Recommendation Model)是阿里妈妈推出的世界知识大模型,基于知识注入和信息对齐,将LLM的通用知识与电商领域的专业知识相结合,解决传统LLM在电商推荐场景中表现欠佳的问题。

    AI教程资讯 2023-04-14

最新录入 更多+
确定