KDD Cup 2024 · Meta LLMs RAG挑战赛 · 冠军方案

🏆 KDD Cup 2024 · Meta LLMs RAG挑战赛 · 冠军 📅 2024年10月6日 👥 北大 db3 团队 📊 任务1 28.4% · 任务2 42.7% · 任务3 47.8%

KDD Cup 2024 Meta LLMs RAG挑战赛冠军方案开源

北京大学 db3 团队 · 检索增强生成 · 知识图谱API设计 · 微调与多源融合

赛题背景

研究表明，GPT-4对快速变化事实的准确性通常低于35%。LLM可能产生幻觉性回应，影响可信度。检索增强生成（RAG）通过整合外部知识源提供有根据的答案，但仍面临选择最相关信息、减少延迟、综合复杂信息等挑战。Meta Comprehensive RAG Challenge（CRAG）提供了一个严格的基准，推动RAG系统创新。

任务目标

挑战包含三个递进任务：

任务1：基于Web的检索摘要 – 每个问题提供5个网页，系统需识别并概括相关信息生成准确答案。
任务2：知识图和Web增强 – 引入模拟API访问知识图谱中的结构化数据，整合多源信息。
任务3：端到端RAG – 提供50个网页和模拟API，从更大数据集中选择最重要数据，模拟真实场景。

评价指标

响应被评定为：完美(1分)、可接受(0.5分)、缺失(0分)、不正确(-1分)。总体得分为宏平均，按领域和实体受欢迎程度加权。

赛题分析

CRAG基准涵盖五个领域、八种问题类型，要求30秒内完成推理。三个任务逐步增加复杂性，第二、三任务涉及非结构化和结构化多源数据融合，冠军方案在三个任务中均获得第一。

冠军方案：北大 db3 团队

任务一：Web检索摘要

数据预处理

使用 BeautifulSoup 提取HTML文本，LangChain CharacterTextSplitter 分块，ParentDocumentRetriever 管理父子块（parent_chunk_size=700, child_chunk_size=200）。
检索器：bge-base-en-v1.5；重排序：bge-reranker-v2-m3；召回数50，根据父块大小调整喂给LLM的chunk数。