609. Playground Series - Season 4, Episode 5 | playground-series-s4e5
大家好,感谢又一场激烈的 Playground Series 竞赛!在展示我的方案之前,我想建议赛期两周可能更为合适。最后的冲刺阶段就像是努力挤出最后几滴优化空间。现在进入正题:
本次竞赛的关键策略是尽可能多地混合模型。之所以这样做,是因为我们实际上是在预测噪声。
我尝试了多种模型混合方法,包括 Lasso 和 Ridge 回归,但最终使用爬山算法(Hill Climbing)获得了最佳效果。我使用了我的 Python 包 hillclimbers 来确定最优权重。
我使用了 3 套特征来训练模型,分别是 FE2 和 FE3(在选权重的柱状图中可见)。这些特征集包括以下几类(不同变体):
我使用了多组超参数,部分手动调优,部分使用 Optuna 优化。例如,我的 DecisionTreeRegressor 集成使用了多组超参数,并将得到的预测结果再次混合。