Amodal3R是什么
Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,利用遮挡先验知识指导重建过程。Amodal3R 仅使用合成数据进行训练,能在真实场景中表现出色,显著优于现有的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建树立了新的基准。

来源:爱论文 时间:2025-04-16 12:35:22
Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,利用遮挡先验知识指导重建过程。Amodal3R 仅使用合成数据进行训练,能在真实场景中表现出色,显著优于现有的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建树立了新的基准。
Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,利用遮挡先验知识指导重建过程。
AI教程资讯
2023-04-14
AutoAgent 是香港大学推出的零代码、自动化 LLM 智能体框架。基于自然语言交互,让用户无需编程即可创建智能助手,适用于智能搜索、数据分析、报告生成等场景。AutoAgent核心功能包括三种使用模式,用户模式、智能体编辑器、工作流编辑器,适应不同用户需求。
AI教程资讯
2023-04-14
Text to Bark 是 ElevenLabs 推出的全球首个AI“狗语”文本转语音模型。用户输入文字选择犬种,模型能生成高度逼真的狗吠声,95%的狗无法分辨其与真实吠声。模型基于开源犬类语言学研究开发,支持个性化选择品种和调整语气,能部署到智能家居设备等“云吠基础设施”。
AI教程资讯
2023-04-14
Cua 是 trycua 团队推出的开源AI Agent项目,为 macOS 用户提供高性能的虚拟化和 AI 代理功能。Cua基于苹果的 Virtualization Framework,支持在 Apple Silicon 上创建运行 macOS 和 Linux 虚拟机,性能接近原生水平(约90%)。
AI教程资讯
2023-04-14