当前位置: 网站首页 >AI教程资讯 >正文

Phi-4-Mini – 微软推出专注于文本任务的小型语言模型

来源:爱论文 时间:2025-03-13 10:40:25

Phi-4-Mini是什么

Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Transformer 架构,结合分组查询注意力(Grouped-Query Attention)、20 万词汇量和共享输入输出嵌入,专为速度和效率设计。Phi-4-Mini 在文本推理、数学计算、编程、指令遵循和函数调用等任务上表现出色,超越了多款参数更大的语言模型。支持最长 128K Token 的序列处理,具备高精度和出色的可扩展性,适合在资源受限的环境中使用。Phi-4-Mini 通过函数调用能力,能与外部工具、API 和数据源无缝集成。

Phi-4-Mini

Phi-4-Mini的主要功能

文本推理与逻辑处理:Phi-4-Mini 在文本推理、数学计算、编程辅助、指令遵循和函数调用等任务上表现出色,超越了许多参数更大的语言模型。长文本支持:支持最长 128K Token 的序列处理,能高效处理长文本内容,适用于需要处理大量文本的应用场景。函数调用与扩展性:Phi-4-Mini 支持函数调用,能通过标准化协议与外部工具、API 和数据源集成,进一步增强其功能。高效部署与跨平台兼容性:模型经过 ONNX Runtime 优化,适用于低成本、低延迟的计算环境,支持跨平台部署。

Phi-4-Mini的技术原理

密集解码器-only Transformer 架构:Phi-4-Mini 采用了仅解码器的 Transformer 架构,基于自注意力机制(Self-Attention Mechanism),能有效捕捉文本序列中的长期依赖关系,擅长处理自然语言生成任务。分组查询注意力(Grouped-Query Attention):模型引入了分组查询注意力机制,通过将查询分组处理,提高了计算效率和模型的并行化能力。共享输入输出嵌入:Phi-4-Mini 使用共享的输入输出嵌入,减少了模型的参数量,同时提高了模型在不同任务上的适应性和效率。高质量训练数据:Phi-4-Mini 的训练数据经过严格筛选和优化,包括合成数据和针对性的数学、编程训练数据,提升了模型在推理和逻辑任务中的表现。

Phi-4-Mini的项目地址

项目官网:Phi-4-MinihuggingFace模型库:https://huggingface.co/microsoft/Phi-4-mini-instruct

Phi-4-Mini的应用场景

问答系统:Phi-4-Mini 在复杂问答任务中表现优异,能快速准确地回答用户的问题,适用于智能客服和知识管理系统。编程辅助:能生成和调试代码,为开发者提供高效的编程支持。多语言翻译与处理:Phi-4-Mini 支持多种语言,适用于全球化语言服务和跨语言应用。边缘计算与设备端部署:Phi-4-Mini 经过优化,支持跨平台部署,适用于资源受限的设备和边缘计算场景。
上一篇:IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音
相关资讯 更多+
  • Phi-4-Mini – 微软推出专注于文本任务的小型语言模型
    Phi-4-Mini – 微软推出专注于文本任务的小型语言模型

    Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Transformer 架构,结合分组查询注意力(Grouped-Query Attention)、20 万词汇量和共享输入输出嵌入,专为速度和效率设计。

    AI教程资讯 2023-04-14

  • IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音
    IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音

    IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅的语音。IndexTTS 的优势是对中文文本的处理能力,支持拼音纠正汉字发音,可通过标点符号精准控制停顿,有效解决了多音字和长尾字符的发音问题。

    AI教程资讯 2023-04-14

  • Scribe – ElevenLabs 推出的高精度语音转文本模型
    Scribe – ElevenLabs 推出的高精度语音转文本模型

    Scribe 是 ElevenLabs 推出的高精度语音转文本模型,专为多语言和复杂音频环境设计。支持99种语言,英语和意大利语的转录准确率分别达到96 7%和98 7%,在小语种上也有出色表现。

    AI教程资讯 2023-04-14

  • VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架
    VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架

    VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意力机制,增强文本提示对目标区域的控制能力,且保持区域间的特征分离,解决现有扩散模型中语义错位和特征耦合的问题。

    AI教程资讯 2023-04-14

最新录入 更多+
确定