当前位置：网站首页 >AI教程资讯 >正文

AgentRefine – 北京邮电大学联合美团推出的智能体合成框架

来源：爱论文时间：2025-03-13 16:09:17

AgentRefine是什么

AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架，通过“精炼调整”（Refinement Tuning）提升基于大型语言模型（LLM）的智能体在多样化任务中的泛化能力。让智能体通过轨迹中的观察学习纠正错误，实现自我优化。研究团队受到桌面角色扮演游戏（TRPG）的启发，设计了包含脚本生成、轨迹生成和验证的数据构建流程。

AgentRefine的主要功能

错误纠正与自我优化：AgentRefine 通过轨迹中的观察让智能体学习纠正错误，实现自我优化。过程类似于人类在面对错误时的反思和调整，智能体能更好地适应新环境和任务。多样化环境与任务集成：框架整合了多种环境和任务，促使智能体在面对复杂场景时能灵活调整策略

上一篇：DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

相关资讯更多+

AgentRefine – 北京邮电大学联合美团推出的智能体合成框架
AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架，通过“精炼调整”（Refinement Tuning）提升基于大型语言模型（LLM）的智能体在多样化任务中的泛化能力。让智能体通过轨迹中的观察学习纠正错误，实现自我优化。

AI教程资讯 2023-04-14
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法（GEMM）设计的库，目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家（MoE）分组的GEMM操作，基于即时编译（JIT）技术，无需安装时编译，支持在运行时动态优化。

AI教程资讯 2023-04-14
TinyR1-Preview – 奇虎360联合北大团队推出的推理模型
TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量，逼近Deepseek-R1-671B的性能，TinyR1-Preview在数学领域（AIME评测78 1分）逼近原版R1（79 8分），远超70B的Deepseek-R1-Distill-Llama（70 0分）。

AI教程资讯 2023-04-14
SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统
SurveyX 是基于大型语言模型（LLMs）自动化生成学术综述的系统，是中国人民大学、悉尼大学和中国东北大学联合推出的。基于用户提供论文标题和关键词，快速生成高质量、特定领域的学术综述或论文。SurveyX系统用先进的语言模型技术，结合数据处理和文献检索能力，帮助用户节省编写学术综述的时间和精力。

AI教程资讯 2023-04-14

最新录入更多+

Rask
学术论文丨 9.9MB
下载
SteveAI
学术论文丨 9.9MB
下载
Pictory
学术论文丨 9.9MB
下载
Elai.io
学术论文丨 9.9MB
下载
AVCLabs
学术论文丨 9.9MB
下载
Colossyan
学术论文丨 9.9MB
下载

热门推荐更多+

SeedVR – 南洋理工和字节跳动推出的扩散变换器模型，实现通用视频修复

2025-01-14

AI专辑热门专辑

【AI教程资讯】 SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型 01-13
【AI教程资讯】 Agent Laboratory – AMD 联合约翰·霍普金斯大学推出的自主科研 Agent 01-13
【AI教程资讯】星火纪要 – 科大讯飞推出的会议交流总结和分析平台 01-13
【AI教程资讯】 rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术 01-13
【AI教程资讯】 Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架 01-20
【AI教程资讯】日日新融合大模型 – 商汤科技推出的原生融合模态大模型 01-13
【AI教程资讯】 ConceptMaster – 高保真多概念视频定制生成的创新 AI 框架 01-13
【AI教程资讯】 Search-o1 – 人大联合清华推出自主知识检索增强的推理框架 01-13
【AI教程资讯】 MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法 01-13
【AI教程资讯】 SPRIGHT – 专注于空间关系的大型视觉语言数据集 01-14

AI工具推荐更多+

1

AiPPT 9.9MB

2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
2

CopyAI 9.9MB

2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
3

巨日禄AI故事绘图 9.9MB

2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
4

135AI排版 9.9MB

2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
5

笔灵AI写作 9.9MB

2025顶尖智能网页抓取工具排名-2025哪款网页抓取器效率最高
6

Typeframes 9.9MB

Typeframes是一个创新的AI在线视频创作平台，允许用户通过简单的文本输入来快速生成专业的产品介绍视频。该工具的核心优势在于它的便捷性和易用性，无需掌握复杂的视频编辑软件，即使是没有视频制作经验的用户也能够利用人工智能轻松创建出高质量的视频内容，将文本转变为引人入胜的产品视频。

确定

AgentRefine &#8211; 北京邮电大学联合美团推出的智能体合成框架

AgentRefine是什么

AgentRefine的主要功能

AgentRefine – 北京邮电大学联合美团推出的智能体合成框架