当前位置: 网站首页 >AI教程资讯 >正文

Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型

来源:爱论文 时间:2025-04-18 13:32:21

Fin-R1是什么

Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构,通过在金融推理场景的高质量思维链数据上进行SFT和RL两阶段训练,有效提升金融复杂推理能力。在权威评测中,Fin-R1平均得分75.2分,与行业标杆DeepSeek-R1仅差3分,位居榜单第二。数据构建融合了多个金融领域的高质量数据集,通过数据蒸馏构建了约60k条高质量COT数据集。

Fin-R1

Fin-R1的主要功能

金融推理与决策:能处理复杂的金融推理任务,如金融数据的数值推理、金融新闻情感分类、因果关系提取等,为金融决策提供准确、可解释的依据。自动化金融业务流程:在金融合规检查、机器人投顾等实际应用中表现出色,可自动化执行金融业务流程,提高效率并降低人工成本。多语言支持:支持中文和英文的金融领域推理,覆盖多种金融业务场景,满足不同语言环境下的金融推理需求。高效资源利用:以7亿参数的轻量化结构实现高性能,显著降低了部署成本,更适合在资源受限的环境中使用。金融代码生成:支持各种金融模型和算法的编程代码生成。金融计算:进行复杂的金融问题的定量分析与计算。英语金融计算:支持使用英语构建和撰写金融模型。金融安全合规:帮助企业确保业务操作符合相关法规。智能风控:利用AI技术识别和管理金融风险,提高决策效率。ESG分析:评估企业的可持续发展能力,促进社会责任履行。

Fin-R1的技术原理

模型架构:Fin-R1基于Qwen2.5-7B-Instruct架构,采用轻量化的7B参数设计。架构在保证模型性能的同时,显著降低了部署成本,更适合在资源受限的环境中使用。数据构建:Fin-R1通过构建高质量金融推理数据集Fin-R1-Data来解决金融数据碎片化的问题。数据集包含约60k条面向专业金融推理场景的高质量COT数据。数据集的构建过程包括从多个权威数据源进行领域知识蒸馏筛选,采用“答案+推理”双轮质量打分筛选方法,确保数据的准确性和可靠性。第一阶段——推理能力注入:使用ConvFinQA和FinQA金融数据集对Qwen2.5-7B-Instruct进行监督微调(SFT),帮助模型初步提升金融推理能力。第二阶段——强化学习优化:在掌握复杂推理技能后,采用GRPO(Group Relative Policy Optimization)算法作为核心框架,结合格式奖励和准确度奖励进行强化学习。同时引入基于模型的验证器(Model-Based Verifier),采用Qwen2.5-Max进行答案评估,生成更加精确可靠的奖励信号,提升强化学习的效果和稳定性。

Fin-R1的项目地址

HuggingFace模型库:https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1arXiv技术论文:https://arxiv.org/pdf/2503.16252

Fin-R1的应用场景

智能风控:在智能风控领域,Fin-R1的动态信用评分模型让风险评估更精准,能实时监测交易异常,有效防范金融风险。投资决策辅助:在基金投资中,能辅助投资顾问进行资产配置,帮助用户做出更明智的决策。量化交易:在证券交易中,Fin-R1可以参与量化交易代码的编写,提升从业者的代码效率,助力量化交易策略的开发。ESG分析:能协助生成符合GRI标准的ESG报告,助力企业绿色转型,满足市场对企业可持续发展的要求。市场趋势预测:在保险行业,Fin-R1能高效评估保单收益,预测市场趋势。
上一篇:Oliva – 开源语音RAG助手,实时语音搜索向量数据库
相关资讯 更多+
  • Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型
    Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型

    Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2 5-7B-Instruct架构,通过在金融推理场景的高质量思维链数据上进行SFT和RL两阶段训练,有效提升金融复杂推理能力。

    AI教程资讯 2023-04-14

  • Oliva – 开源语音RAG助手,实时语音搜索向量数据库
    Oliva – 开源语音RAG助手,实时语音搜索向量数据库

    Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时搜索信息。用户基于自然语音提问,Oliva 用语音转文本和实时语音通信技术,将语音指令转化为对数据库的查询,返回结构化结果。

    AI教程资讯 2023-04-14

  • Qwen2.5-Omni – 阿里开源的端到端多模态模型
    Qwen2.5-Omni – 阿里开源的端到端多模态模型

    Qwen2 5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2 5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持流式文本生成与自然语音合成输出,能实现实时语音和视频聊天。

    AI教程资讯 2023-04-14

  • Cosmos-Reason1 – NVIDIA推出的系列多模态大语言模型
    Cosmos-Reason1 – NVIDIA推出的系列多模态大语言模型

    Cosmos-Reason1 是 NVIDIA 推出的一系列多模态大型语言模型,基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型:Cosmos-Reason1-8B 和 Cosmos-Reason1-56B。模型基于视觉输入感知世界,经过长链思考后生成自然语言响应,涵盖解释性见解和具身决策(如下一步行动)。

    AI教程资讯 2023-04-14

最新录入 更多+
确定