当前位置: 网站首页 >AI教程资讯 >正文

TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术

来源:爱论文 时间:2025-04-18 15:13:31

TaoAvatar是什么

TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支持高分辨率渲染且存储需求低。TaoAvatar可在多种移动和AR设备上以90FPS的高帧率实时运行,通过语音、表情、手势和身体姿势等多种信号驱动,实现口型、表情和动作的自然同步。

TaoAvatar

TaoAvatar的主要功能

高保真全身动态虚拟形象生成:能从多视角图像序列中生成逼真的、拓扑结构一致的3D全身虚拟形象,支持对姿态、手势和表情的精细控制。实时渲染与低存储需求:可在多种移动和AR设备上以90FPS的高帧率实时运行,支持高分辨率渲染,同时保持低存储需求。多信号驱动:可通过语音、表情、手势和身体姿势等多种信号驱动,实现口型、表情和动作的自然同步。轻量级架构:通过将复杂的非刚性变形“烘焙”到轻量级的MLP网络中,结合混合形状补偿细节,显著提高了运行效率。

TaoAvatar的技术原理

3D高斯溅射(3DGS)技术::3DGS通过使用3D高斯函数来表示场景中的点,将这些高斯函数投影到2D图像平面上进行渲染。每个3D高斯由位置、协方差、颜色和透明度等参数描述。通过结构光(Structure from Motion, SfM)技术从多视角图像中估计3D点云,然后将每个点转换为高斯函数,使用随机梯度下降进行训练。姿态依赖非刚性变形处理:TaoAvatar将复杂的非刚性变形分解为刚性变形和形状变形两部分,通过知识蒸馏技术将形状变形“烘焙”到轻量级的MLP网络中。能高效处理复杂的姿态依赖非刚性变形,同时保持虚拟形象的逼真度和可控性。可学习的高斯混合形状:为了进一步增强虚拟形象的外观细节,TaoAvatar引入了可学习的高斯混合形状。通过训练神经网络学习不同姿态和表情下的高斯混合形状参数,然后将这些参数应用到虚拟形象上。使虚拟形象在不同姿态和表情下都能保持极高的保真度。实时渲染与优化:TaoAvatar采用多种优化技术,如GPU加速、减少不必要的计算、优化模型结构和参数等,实现高质量的实时渲染。在高清立体显示设备如Apple Vision Pro上,能保持每秒90帧的流畅运行。

TaoAvatar的项目地址

项目官网:https://pixelai-team.github.io/TaoAvatar/arXiv技术论文:https://arxiv.org/pdf/2503.17032

TaoAvatar的应用场景

电子商务直播:创建逼真的虚拟主播,提升用户体验并降低人力成本。全息通信:在远程通信中生成逼真的虚拟形象,增强沉浸感。虚拟会议:参与者可使用个性化的虚拟形象进行交流,增强互动性。在线教育:利用虚拟人进行在线课程教学,增加趣味性。虚拟娱乐:在游戏和虚拟现实应用中创建个性化的虚拟角色。
上一篇:Mureka O1 – 昆仑万维推出的音乐推理大模型
相关资讯 更多+
  • TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术
    TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术

    TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支持高分辨率渲染且存储需求低。

    AI教程资讯 2023-04-14

  • Mureka O1 – 昆仑万维推出的音乐推理大模型
    Mureka O1 – 昆仑万维推出的音乐推理大模型

    Mureka O1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(Chain of Thought,CoT)技术的音乐模型,Mureka O1在推理过程中加入思考与自我批判机制,大幅提升了音乐品质、创作效率和灵活性。

    AI教程资讯 2023-04-14

  • Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
    Mureka V6 – 昆仑万维推出的AI音乐创作基座模型

    Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术,使声场更加开阔,人声质感和混音设计进一步强化。

    AI教程资讯 2023-04-14

  • Video-T1 – 清华联合腾讯推出的视频生成技术
    Video-T1 – 清华联合腾讯推出的视频生成技术

    Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在训练后直接生成视频,Video-T1 在测试阶段引入额外计算资源,基于动态调整生成路径优化视频质量。

    AI教程资讯 2023-04-14

最新录入 更多+
确定