返回列表

7th place solution, single model, no supplemental data used

500. Ubiquant Market Prediction | ubiquant-market-prediction

开始: 2022-01-18 结束: 2022-07-19 量化投资 数据算法赛
第7名方案,单模型,未使用补充数据

第7名方案,单模型,未使用补充数据

作者: Wenrui Kong
比赛排名: 第7名

大家好,
首先简单介绍一下自己。我目前在北京的一家小型对冲基金工作。我参加这次比赛是为了测试我在工作中的一些想法,看看它们是否适用于不同的特征集。我的方案其实是一个基线模型,没有逆向工程,没有模型融合,甚至没有使用提供的补充训练数据。

我不会公开我的完整方案,但以下是关于该模型的一些事实。

模型和超参数

该模型是一个单独的 LGB 模型,参数为手工调整,未使用任何自动调参包。'extra_trees' 参数被设置为 'True'。当树的数量很大时,这带来了稳定的提升。

特征工程与选择

这算是我的秘诀。模型输入了 900 多个特征,这些特征是从一个更大的特征池中筛选出来的。
作为对照,在我的第二次提交中,我使用了一个类似的模型,但只使用了 300 个原始特征。那个模型的得分是 0.112,甚至没有达到获奖(奖牌)范围。

交叉验证

使用了标准的 TimeSeriesSplit(时间序列分割)。

我想我是运气好,但这并不是因为什么神奇的随机种子,而是因为大多数人对金融市场不熟悉,从而导致在公共排行榜上过拟合。感谢所有参加比赛的人。

同比赛其他方案