XVERSE-MoE-A36B是什么
XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B参数的大模型相媲美,实现跨级的性能跃升。相比于传统的稠密模型,XVERSE-MoE-A36B在训练时间上减少30%,推理性能提升100%,大幅降低每token的成本,使AI应用实现低成本部署。

来源:爱论文 时间:2025-04-30 12:02:18
XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B参数的大模型相媲美,实现跨级的性能跃升。相比于传统的稠密模型,XVERSE-MoE-A36B在训练时间上减少30%,推理性能提升100%,大幅降低每token的成本,使AI应用实现低成本部署。
XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B参数的大模型相媲美,实现跨级的性能跃升。
AI教程资讯
2023-04-14
PyVideoTrans 是开源的视频翻译配音工具,将视频内容从一种语言自动翻译成另一种语言,并添加相应的字幕和配音。PyVideoTrans支持多语言,具备高效的语音识别和准确的文字翻译功能,同时使用高质量的语音合成技术来生成配音。
AI教程资讯
2023-04-14
ongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。
AI教程资讯
2023-04-14
CSGO(Content-Style Composition in Text-to-Image Generation)是由南京理工大学、小红书等机构合作开发的图像风格迁移和文本到图像生成的研究项目。CSGO的目标是为用户提供更加丰富和多样化的图像创作工具。
AI教程资讯
2023-04-14