TesserAct是什么
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传统的 2D 模型,能将详细的形状、配置和时间变化纳入预测中。TesserAct 的核心优势在于其时空一致性,支持新视角合成,显著提升了策略学习的性能。

来源:爱论文 时间:2025-05-14 09:31:32
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传统的 2D 模型,能将详细的形状、配置和时间变化纳入预测中。TesserAct 的核心优势在于其时空一致性,支持新视角合成,显著提升了策略学习的性能。
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传统的 2D 模型,能将详细的形状、配置和时间变化纳入预测中。
AI教程资讯
2023-04-14
VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具,简化与大语言模型(LLM)的交互、状态管理、外部工具连接和工作流编排的复杂性。
AI教程资讯
2023-04-14
Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2 5-1 5B 构建,仅包含 1 5 亿参数。专为长音频处理设计,能支持长达 15 分钟的连续音频输入,无需分段,同时保持上下文连贯性。
AI教程资讯
2023-04-14
DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通过推理增强监督和强化学习提升金融推理任务的表现,核心是DianJin-R1-Data数据集,整合了CFLUE、FinQA和中国合规检查(CCC)数据集,涵盖多样化的金融推理场景。
AI教程资讯
2023-04-14