返回列表

三等奖方案细节版|基于Data Menu RAG的金融多模态报告生成智能体

AFAC2025挑战组-赛题四:智能体赋能的金融多模态报告自动化生成 | 532354

开始: 2025-07-23 结束: 2025-07-31 金融文本智能 AI大模型赛
三等奖方案细节版|基于Data Menu RAG的金融多模态报告生成智能体 cover_image

三等奖方案细节版|基于Data Menu RAG的金融多模态报告生成智能体

AFAC2026 · 在小说阅读器中沉浸阅读

答辩现场

随着保险业务数字化推进,传统人工校验难以应对长文本上下文一致性核验需求,且效率低、误差高。多源文件一致性校验的核心是解决 “规则理解模糊”“长文本处理受限”“冲突误判” 三大痛点,本质是结合数据预处理与智能 Agent 协同的自然语言处理任务。

本团队荣获AFAC大赛挑战组赛题四:金融多模态报告生成智能体 第四名。

团队介绍

我是小宇,目前就职于常熟农商银行,任风控研发团队负责人。崇尚“极客精神”,热爱探索各类新技术。通过本次比赛收获良多,不仅磨炼了技术水平,还了解到行业最新发展动态拓展了视野。对主办方表示衷心感谢,祝越办越好。

联系方式:nambo@foxmail.com
对应代码已开源,详见:https://github.com/nambo/menu-rag

近些年,随着人工智能相关技术的突飞猛进,金融科技正经历前所未有的变革。金融研究报告(研报)因其专业性高、涉及内容广泛,一直是金融领域的核心产出。随着“大模型”的日益强大,以及相关配套生态的逐渐完善,构建基于大模型的 Agent,成为大模型应用的主流方向。

本方案是“2025金融智能创新大赛”的参赛项目,目标是基于大模型及 Agent 相关技术,构建自动化智能体,完成研报的信息收集、内容生成、图表绘制等工作,自动生成金融研报。目前已经完成基础架构设计和 MVP 开发,基于 MVP 版本能够完成数万字的个股、行业、宏观研报的编制工作,在上述创新大赛相关赛题中,荣获三等奖。

该方案中设计的智能体架构,具备较好的生成效率及灵活的拓展能力。除了赛题指定的三个场景以外,通过新数据引入和简单的提示词调整,即可完成新场景研报智能体构建,在金融研报领域具备较好的应用前景。

架构方案

1 DataMenuRAG介绍

本方案创新性的提出并使用了 Data Menu RAG(简称 DM-RAG),这是一种新型 RAG 架构,它在传统 RAG 的两个关键阶段进行改进,解决了传统 RAG 存在的信息损失、多源信息整合、实时性等方面的局限性,相较于传统 RAG 方案,主要改进点如下:

  1. 知识库构建阶段
    与传统 RAG 直接获取原始文档进行切割分块不同,DM-RAG 的知识库构建过程,采用了一种关键字动态知识摘要的方法,如下图:
知识库构建图

大致过程为:关键字生成 → 搜索 → 信息摘要 → 字典构建 → 向量存储。

这样做的优势在于:

  • 无切割:不会对文档进行分块,能够最大程度保障信息的完整性,有效的避免信息损失、主体紊乱、信息泛滥等问题;
  • 多模态:借助大模型的多模态能力,可以有效的实现对表格、图片等非文本数据处理和引用;
  • 实时性:搜索结果通常包含摘要,往往仅需搜索无需获取详情,大幅减少了网络请求次数与耗时,提升知识库构建的实时性。
  1. 生成阶段
    传统 RAG 方案是基于检索到的文档块和输入问题生成回答,而 DM-RAG 采用的是动态知识摘要融合策略。
生成阶段图

大致过程为:问题衍生 → 并行检索 → 相关性检测 → 详情获取与摘要生成 → 生成回答。

这么做的好处包括:

  • 语义完整:通过知识摘要,而不是文档分块,确保引用的信息语义完整;
  • 消除语义鸿沟:通过问题衍生拓展问题语义,通过多角度知识摘要拓展数据语义,再将两者相结合,可以有效的避免语义鸿沟;
  • 避免噪声:通过相关性检测和知识摘要,可以过滤掉绝大部分噪声干扰。

关于 DM-RAG 的详细介绍,你可以阅读这篇文章《Data Menu RAG: 一种基于动态知识摘要的新型检索增强生成框架》。

2 架构概览

在金融研报这类深度研究场景,为了保障内容丰富度和信息全面性,往往需要整合数以千计资料和数据,同时还涉及对特定数据的专业建模分析。目前主流的方案是基于 RAG 技术,将原始资料/数据根据语义进行分割,创建向量索引后分块存储,然后基于特定问题进行向量检索到信息块,最后再做归纳汇总。这种方案不适用于 DeepResearcher 场景,主要问题在于文档的采集与分割过程,不仅会消耗大量计算资源和时间,还会存在不可控的信息损失,导致最终生成效率很低、效果较差。因此,本方案创新性的采用了“Data Menu RAG”技术实现,如下图:

架构概览

3 知识库构建

信息搜索、采集与知识库构建过程如下:

  • 生成研报大纲:基于问题生成研报的所有章节标题及内容提示;
  • 生成信息搜索关键字:根据研报的大纲,生成需要在互联网进行信息搜索的关键字;
  • 信息搜索:使用关键字,并行在互联网搜索信息;
  • 相关性检测与字典构建:并行检测搜索到的结果与原始问题、大纲的相关性,过滤无关信息,并获取摘要转换为数据字典结构;
  • 向量存储:将字典内容向量化,并构建元数据,存储到向量库中。
知识库构建过程

知识库中保存了如下的数据:

知识库数据示例

4 检索与生成

在完成资料库构建后,将基于大纲逐一生成每个章节的内容,内容生成过程如下:

  • 问题衍生:基于章节的内容,衍生出多个待检索的问题;
  • 检索与相关性检测:基于生成的问题,并行检索,并检测过滤与章节无关结果;
  • 详情采集与摘要:根据检索到的相关字典项,采集对应的详情,并生成与章节内容相关的摘要。如果是分析类型字典,还会调用对应的专业分析函数,生成专业分析报告;
  • 章节内容生成:根据章节内容提示,结合生成的摘要清单,融合生成章节内容并标注引用。
检索与生成

5 应用架构

基于上述 Data Menu RAG 的基本思想,最终构建了多层级的多 Agent 架构,如下图所示:

应用架构

从下往上共分为 4 个层级,分别是:

  • 信息层:采集统计局、人行、国务院、交易所等官方权威平台数据,为研报生成提供高质量数据支撑;
  • 基础层:采用最新的高性能组件,为高效率生成提供技术保障;
  • 服务层:采用 MCP 协议,构建了绘图、数据(或称为内容)两大基础 Agent;
  • 应用层:可以根据使用场景,通过简单的提示词调整,灵活配置不同的 Agent。

创新点

  • 基于数据字典的增强检索生成(Data Menu RAG)技术:创新的提出“基于数据字典的增强检索”技术,解决了传统 RAG 技术,在公开信息研报场景,存在的速度慢、资源消耗高、信息损失等问题,研报生成效率和质量大幅提升。
  • 多级缓存与“断点重试”:免费数据源稳定性较差,在大模型会话、数据源获取等关键点设置了多层级的缓存。出现异常时,会自动清理异常缓存,回滚至最近成功点重新继续执行,确保 100% 成功生成研报,且单篇研报最低仅需消耗 30 万 Token 左右。
  • 并行生成:在内容数据采集、图表绘制等耗时大的节点,实现了多任务并行生成。在调高并行度且命中大量缓存的情况下,最快 10 分钟左右可完成研报生成。
  • 数据接入:开发了一套数据接入规范,按照约定的数据字典结构,实现 2 个标准函数(出入参格式、函数名),即可快速接入新的数据源,用于研报生成。
  • 场景拓展:采用多层 agent 架构,服务层 Agent 已封装通用基础能力,通过应用层 Agent 简单的提示词调整,即可灵活、便捷的实现新场景拓展。

应用成效

  • 研报质量:凭借该方案构建 mvp 版本生成的研报,在 AFAC2025 比赛中,获得了三等奖;
  • 生成速度:最快 10min 即可生成一篇研报,进行进一步优化,有希望实现秒级的万字研报生成。不同场景生成速度及不同阶段耗时如下:
生成速度1 生成速度2
  • 资源消耗:最少只需要 30w token 即可生成一篇。不同场景及不同阶段消耗 token 如下:
token消耗1 token消耗2

产业应用前景

在这个信息爆炸的时代,如果能从海量的信息中抽丝剥茧,快速汇聚成一份准确、专业的报告,这对于生活、学术或是商业,都能带来很大价值。通过本次比赛验证,本方案在研报的生成质量、速度和资源消耗等方面均有很好的应用潜力。未来,将进行持续迭代优化,从金融领域出发,探索在企业科创能力评估、行业发展研究等具体场景的应用落地,并拓展至更多场景。

未来展望

Data Menu RAG 相较于传统 RAG 方案,在信息损失、多源信息整合、实时性等方面有大幅的改进,特别适合以下场景:

  1. 复杂问题求解:当问题涉及多领域或需要综合多种数据源时,DM-RAG 的表现会明显优于传统 RAG,例如:综合调研报告、方案对比选型、数据分析报告。
  2. 信息实时变化的领域:在知识更新频繁,对信息时效性要求高的领域,DM-RAG 可以提供更好的时效性,例如:实时资讯整合、新型技术研究、政策规定解读。
  3. 准确性要求高的场景:对于信息准确性要求极高的场景中,DM-RAG 通过动态知识摘要融合,可以确保信息的完整性和准确性,例如:医疗诊断支持、金融投资领域、学术研究辅助。
同比赛其他方案