https://tianchi.aliyun.com/competition/entrance/532164/information
欢迎加入2023年“博金大模型挑战赛”。随着人工智能和数字化技术在金融领域的日益广泛应用,本次赛事旨在汇集全国技术精英,共同探索大语言模型在金融科技中的应用潜力。本次挑战赛由中国计算机学会(CCF)主办,CCF计算经济学专业组、北大前沿计算研究中心、北大创新评论共同承办,携手博时基金、阿里云、天池、魔搭、金证股份等协办单位,专为期待大模型技术在基金研究领域带来革命性创新的您而策划。
未来金融科技领域将深刻体现Agent的价值,即一个智能代理能根据用户需求进行意图识别和决策。本次大赛的赛题虽为单一,但融合了数据查询与文本理解两大任务,充分体现了Agent核心思想:根据不确定输入,判断用户意图,并调用相应服务或功能生成答案。
选手需以“通义千问金融大模型”或“通义千问7B模型”(不限制pretrain和chat)作为基础大模型,可以结合多个模型,共同创建一个问答系统。可以采用Prompt Engineering方法,也可以使用外部数据对模型进行微调。
在初赛开始阶段,赛事主办方会为参赛选手提供比赛涉及的全部结构化数据和文本数据,包括10张基金表数据和80篇招股书文档,初复赛所有问题的答案均可在数据中查询得到。
初赛题目question.jsonl,包含1000道测试题目,以jsonl文件提供,初复赛题目格式保持一致。
测试数据如下
{"id": 0, "question": "景顺长城中短债债券C基金在20210331的季报里,前三大持仓占比的债券名称是什么?"}
{"id": 1, "question": "上海华铭智能终端设备股份有限公司的首发战略配售结果如何?"}
赛题数据下载方法:
git clone https://www.modelscope.cn/datasets/BJQW14B/bs_challenge_financial_14b_dataset.git
主要考察选手基于大语言模型的问答能力, 我们构造以下打分标准:
每道题打分满分为1分,其中:
https://github.com/Tongyi-EconML/FinQwen