当前位置: 网站首页 >AI教程资讯 >正文

交交 – 上海交大推出的口语对话情感大模型

来源:爱论文 时间:2025-04-27 19:33:19

交交是什么

交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学术界自研的口语对话情感大模型。交交具备多人对话、多语言交流、方言理解、角色扮演、情感互动及知识问答等强大功能,支持汉语、英语、日语、法语等多种语言,能精准识别中文方言。交交基于创新技术,实现端到端语音对话、多语言理解、多人互动及实时音色克隆。交交展现强大的语音交互能力,为智能语音助手领域带来新的突破。

交交的主要功能

多人对话:同时与多位用户进行自然流畅的对话,精准识别每个人的身份和发言内容,给出个性化的回应。多语言交流:支持汉语、英语、日语和法语四大主流语言,具备跨语言回复能力。角色扮演与情感互动:根据对话内容和场景理解用户情绪,生成富有情感的回应。知识问答:涵盖广泛的知识领域,如古诗词背诵、科学原理讲解、文学名著解读等。实时音色克隆:提供高保真声音模仿技术,支持多角色语音扮演风格及与用户自身声音之间的实时无感切换。

交交的技术原理

端到端语音对话:基于鲁棒的音频编码器,将音频输入流式编码器得到离散序列,对齐到文本序列空间,无需大规模高质量数据微调,即可保持和利用文本大模型的基础泛化能力,实现实时知识问答。多语言理解与生成:基于创新的跨模态对齐机制,将多语言语音信号与对应文本在特征空间实现精准映射,用隐式表征学习保留语言特异性信息,结合深度语言模型的上下文建模能力,实现跨语言场景下的无缝切换与高效语义理解。多人对话建模:构造多人对话数据,模拟真实场景,增强模型的对话处理能力。用端到端模型融合上下文信息,生成个性化的响应和总结,实现自然且连贯的多方互动。情感理解与表达:基于上下文信息,用思维链技术生成符合对话场景的情感全局表征,用在生动的情感语音回复生成,提升对话交流的真实感。实时音色克隆与切换:提供高保真声音模仿技术,基于思维链技术进行控制信号推理,支持多角色语音扮演风格及与用户自身声音之间的实时无感切换。灵活拓展:强大的对齐策略,支持文本与音频模态的任意方式拼接融合,为集成大规模文本大模型中的多种增强机制(如联网搜索、RAG检索增强生成等)提供统一且可扩展的接口。

交交的项目地址

申请体验地址:https://wj.sjtu.edu.cn/q/4FiP8hsB

交交的应用场景

教育辅导:为学生提供个性化学习指导,解答问题,辅助教师教学。家庭互动:在家庭聚会中娱乐助兴,日常陪伴家人聊天解闷。商务沟通:协助会议记录与总结,支持跨语言商务交流。客服支持:快速响应客户咨询,提供专业解答,提升服务效率。娱乐陪伴:参与角色扮演,提供情感支持,增加生活趣味。
上一篇:GLM-Z1-32B – 智谱开源的新一代推理模型
相关资讯 更多+
  • 交交 – 上海交大推出的口语对话情感大模型
    交交 – 上海交大推出的口语对话情感大模型

    交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学术界自研的口语对话情感大模型。交交具备多人对话、多语言交流、方言理解、角色扮演、情感互动及知识问答等强大功能,支持汉语、英语、日语、法语等多种语言,能精准识别中文方言。

    AI教程资讯 2023-04-14

  • GLM-Z1-32B – 智谱开源的新一代推理模型
    GLM-Z1-32B – 智谱开源的新一代推理模型

    GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型开发,基于深度优化训练,在数学、代码和逻辑等任务上表现出色,部分性能可媲美参数量高达 6710 亿的 DeepSeek-R1。

    AI教程资讯 2023-04-14

  • GLM-4-32B – 智谱开源的新一代基座模型
    GLM-4-32B – 智谱开源的新一代基座模型

    GLM-4-32B是智谱公司开源的新一代基座模型,参数版本为GLM-4-32B-0414。GLM-4-32B经过15T高质量数据预训练,强化代码生成、推理和工程任务能力,支持HTML、CSS、JS、SVG等语言的实时代码展示与运行。

    AI教程资讯 2023-04-14

  • Magnitude – 开源 AI Agent 驱动的端到端测试框架
    Magnitude – 开源 AI Agent 驱动的端到端测试框架

    Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例,用强大的推理代理规划和调整测试流程,基于快速的视觉代理执行测试。Magnitude 支持本地运行和 CI CD 流水线集成,提供托管服务,包括托管的浏览器基础设施和 LLM 基础设施,简化测试管理。

    AI教程资讯 2023-04-14

最新录入 更多+
确定