当前位置: 网站首页 >AI教程资讯 >正文

3DHM – 3D人体动作生成框架,单张图片生成任意视频动作

来源:爱论文 时间:2025-01-20 14:50:25

3DHM是什么

3DHM(3D Human Motions)是先进的3D人体动作生成技术,加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频,实现从静态图像到动态视频的转变。技术通过学习人体不可见部分的先验知识,结合给定的3D运动序列,渲染出具有适当服装和纹理的新身体姿势。3DHM的应用范围广泛,包括电影特效、虚拟现实和游戏开发等,为动画制作和人体动作模拟提供了新的可能性。

3DHM的主要功能

动作生成:3DHM能根据文本描述生成相应的3D人体动作,如跑步、跳舞、打篮球等。动作编辑:支持基于掩码的编辑功能,用户指定动作的特定部分进行编辑,例如改变动作的持续时间或细节。动作评估:提供评估脚本,用于评估生成动作的质量和逼真度。纹理图案修复:用单张照片生成不完整的纹理图案,通过扩散模型修复以生成完整的纹理图案。人体渲染:基于3D人体姿势控制的渲染pipeline,可以生成目标人物在不同姿势下的逼真渲染,包括衣服、头发和看不见区域下的合理填充。模仿动作:3DHM框架能模仿目标视频中的动作,包括肢体动作以及衣服和人物外观的变化。3D控制:3DHM能使用各种合成相机轨迹来渲染人物,生成一系列忠实于目标运动的3D姿态,在视觉上与输入更相似的图像。

3DHM的技术原理

纹理图案修复(Inpainting Diffusion):用单张照片生成不完整的纹理图案,并使用扩散模型修复以生成完整的纹理图案。首先,从给定的单张照片中提取部分可见的纹理图案及其对应的mask。然后,将这些输入传入扩散模型,以生成一个包含未见区域的完整纹理图案。人体渲染(Rendering Diffusion):在第二阶段,目标是获得一个更真实的人物渲染,包括衣物、发型和身体形状等细节。将第一阶段生成的纹理图案应用于演员的3D身体网格序列,生成一个模仿者执行演员动作的中间渲染。然后,将获得的中间渲染和原始人物照片输入到渲染扩散中,从而根据给定输入渲染具有真实外观的人物。预测模型4DHumans:3DHM框架充分基于来自最先进的预测模型4DHumans的准确3D姿势预测的优势,模型能准确地跟踪人体动作并提取演员视频的3D人体姿势。

3DHM的项目地址

项目官网:https://boyiliee.github.io/3DHMGithub仓库:https://github.com/Boyiliee/3DHMarXiv技术论文:https://arxiv.org/pdf/2401.10889

3DHM的应用场景

电影特效制作:3DHM可以用于生成复杂的角色动画,减少手动动画制作的工作量,提高电影特效的真实感和效率。虚拟现实(VR):在VR应用中,3DHM可以用于实时生成用户身体的3D模型,增强用户的沉浸感和交互体验。游戏开发:游戏开发者可以用3DHM快速生成多样化的角色动画,提高游戏的丰富性和开发效率。舞蹈和体操:3DHM能生成舞蹈或体操等动作的高质量视频内容,适用于体育训练和表演艺术的数字化展示。动作模仿:3DHM能模仿目标视频中的动作,包括肢体动作以及衣服和人物外观的变化,适用于动作捕捉和动画制作。
上一篇:Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架
相关资讯 更多+
  • 3DHM – 3D人体动作生成框架,单张图片生成任意视频动作
    3DHM – 3D人体动作生成框架,单张图片生成任意视频动作

    3DHM(3D Human Motions)是先进的3D人体动作生成技术,加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频,实现从静态图像到动态视频的转变。技术通过学习人体不可见部分的先验知识,结合给定的3D运动序列,渲染出具有适当服装和纹理的新身体姿势。

    AI教程资讯 2023-04-14

  • Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架
    Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架

    Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散度,专为扩散模型设计,通过计算沿扩散过程的KL散度积分来比较分布。

    AI教程资讯 2023-04-14

  • VidTok – 微软开源的视频分词器,支持连续和离散分词化
    VidTok – 微软开源的视频分词器,支持连续和离散分词化

    VidTok(Video Tokenizer)是微软开源的先进的视频分词器,通过高效的算法将视频内容转换成一系列“视频词”。支持连续和离散分词化,具有灵活的压缩率和多样化的隐空间,适用于不同的应用场景。

    AI教程资讯 2023-04-14

  • Infinity – 字节跳动推出的高分辨率图像生成模型
    Infinity – 字节跳动推出的高分辨率图像生成模型

    Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升图像生成的细节和质量,超越现有的顶级扩散模型,生成一张1024×1024的高质量图像仅需0 8秒,比SD3-Medium快2 6倍,且具有更快的推理速度。

    AI教程资讯 2023-04-14

最新录入 更多+
确定