当前位置: 网站首页 >AI教程资讯 >正文

AgentRefine – 北京邮电大学联合美团推出的智能体合成框架

来源:爱论文 时间:2025-03-13 16:09:17

AgentRefine是什么

AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架,通过“精炼调整”(Refinement Tuning)提升基于大型语言模型(LLM)的智能体在多样化任务中的泛化能力。让智能体通过轨迹中的观察学习纠正错误,实现自我优化。研究团队受到桌面角色扮演游戏(TRPG)的启发,设计了包含脚本生成、轨迹生成和验证的数据构建流程。

AgentRefine

AgentRefine的主要功能

错误纠正与自我优化:AgentRefine 通过轨迹中的观察让智能体学习纠正错误,实现自我优化。过程类似于人类在面对错误时的反思和调整,智能体能更好地适应新环境和任务。多样化环境与任务集成:框架整合了多种环境和任务,促使智能体在面对复杂场景时能灵活调整策略
上一篇:DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
相关资讯 更多+
  • AgentRefine – 北京邮电大学联合美团推出的智能体合成框架
    AgentRefine – 北京邮电大学联合美团推出的智能体合成框架

    AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架,通过“精炼调整”(Refinement Tuning)提升基于大型语言模型(LLM)的智能体在多样化任务中的泛化能力。让智能体通过轨迹中的观察学习纠正错误,实现自我优化。

    AI教程资讯 2023-04-14

  • DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
    DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

    DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术,无需安装时编译,支持在运行时动态优化。

    AI教程资讯 2023-04-14

  • TinyR1-Preview – 奇虎360联合北大团队推出的推理模型
    TinyR1-Preview – 奇虎360联合北大团队推出的推理模型

    TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78 1分)逼近原版R1(79 8分),远超70B的Deepseek-R1-Distill-Llama(70 0分)。

    AI教程资讯 2023-04-14

  • SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统
    SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统

    SurveyX 是基于大型语言模型(LLMs)自动化生成学术综述的系统,是中国人民大学、悉尼大学和中国东北大学联合推出的。基于用户提供论文标题和关键词,快速生成高质量、特定领域的学术综述或论文。SurveyX系统用先进的语言模型技术,结合数据处理和文献检索能力,帮助用户节省编写学术综述的时间和精力。

    AI教程资讯 2023-04-14

最新录入 更多+
确定