大家好!我很高兴能获得金牌,我想与大家分享我的解决方案:
- 这是一个单分类模型(是的!不是回归模型)
- 该解决方案基于一个复杂的 DNN,它是 ICR 竞赛 的获胜方案。当我看到它时就很喜欢,一直在等待一个可以应用它的竞赛。
- 使用 IterativeImputer 类作为填补缺失值的策略,该类基于其他特征对每个缺失值的特征进行建模,并使用该估计值进行填补。我决定使用训练数据和测试数据进行拟合,并在线训练模型,以便可以利用私有测试集的数据。
- 从活动记录数据中提取 enmo,区分工作日和周末,并按天和时间段进行分组。
- 使用所有数据进行训练
- 在损失函数中使用权重来平衡类别
- 对同一模型使用 10 个不同种子的预测结果取平均
非常感谢本次竞赛的组织者以及所有分享想法和代码的参与者!
这里我分享我的解决方案代码。