Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型-爱论文

Fin-R1是什么

Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构，通过在金融推理场景的高质量思维链数据上进行SFT和RL两阶段训练，有效提升金融复杂推理能力。在权威评测中，Fin-R1平均得分75.2分，与行业标杆DeepSeek-R1仅差3分，位居榜单第二。数据构建融合了多个金融领域的高质量数据集，通过数据蒸馏构建了约60k条高质量COT数据集。

Fin-R1的主要功能

金融推理与决策：能处理复杂的金融推理任务，如金融数据的数值推理、金融新闻情感分类、因果关系提取等，为金融决策提供准确、可解释的依据。自动化金融业务流程：在金融合规检查、机器人投顾等实际应用中表现出色，可自动化执行金融业务流程，提高效率并降低人工成本。多语言支持：支持中文和英文的金融领域推理，覆盖多种金融业务场景，满足不同语言环境下的金融推理需求。高效资源利用：以7亿参数的轻量化结构实现高性能，显著降低了部署成本，更适合在资源受限的环境中使用。金融代码生成：支持各种金融模型和算法的编程代码生成。金融计算：进行复杂的金融问题的定量分析与计算。英语金融计算：支持使用英语构建和撰写金融模型。金融安全合规：帮助企业确保业务操作符合相关法规。智能风控：利用AI技术识别和管理金融风险，提高决策效率。ESG分析：评估企业的可持续发展能力，促进社会责任履行。

Fin-R1的技术原理

模型架构：Fin-R1基于Qwen2.5-7B-Instruct架构，采用轻量化的7B参数设计。架构在保证模型性能的同时，显著降低了部署成本，更适合在资源受限的环境中使用。数据构建：Fin-R1通过构建高质量金融推理数据集Fin-R1-Data来解决金融数据碎片化的问题。数据集包含约60k条面向专业金融推理场景的高质量COT数据。数据集的构建过程包括从多个权威数据源进行领域知识蒸馏筛选，采用“答案+推理”双轮质量打分筛选方法，确保数据的准确性和可靠性。第一阶段——推理能力注入：使用ConvFinQA和FinQA金融数据集对Qwen2.5-7B-Instruct进行监督微调（SFT），帮助模型初步提升金融推理能力。第二阶段——强化学习优化：在掌握复杂推理技能后，采用GRPO（Group Relative Policy Optimization）算法作为核心框架，结合格式奖励和准确度奖励进行强化学习。同时引入基于模型的验证器（Model-Based Verifier），采用Qwen2.5-Max进行答案评估，生成更加精确可靠的奖励信号，提升强化学习的效果和稳定性。

Fin-R1的项目地址

HuggingFace模型库：https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1arXiv技术论文：https://arxiv.org/pdf/2503.16252

Fin-R1的应用场景

智能风控：在智能风控领域，Fin-R1的动态信用评分模型让风险评估更精准，能实时监测交易异常，有效防范金融风险。投资决策辅助：在基金投资中，能辅助投资顾问进行资产配置，帮助用户做出更明智的决策。量化交易：在证券交易中，Fin-R1可以参与量化交易代码的编写，提升从业者的代码效率，助力量化交易策略的开发。ESG分析：能协助生成符合GRI标准的ESG报告，助力企业绿色转型，满足市场对企业可持续发展的要求。市场趋势预测：在保险行业，Fin-R1能高效评估保单收益，预测市场趋势。