返回列表

14th place solution

633. Child Mind Institute — Problematic Internet Use | child-mind-institute-problematic-internet-use

开始: 2024-09-19 结束: 2024-12-19 健康管理与公共卫生 数据算法赛
第 14 名解决方案 - Laura Romar

第 14 名解决方案

作者: Laura Romar
发布日期: 2024-12-20
竞赛排名: 14

大家好!我很高兴能获得金牌,我想与大家分享我的解决方案:

  • 这是一个单分类模型(是的!不是回归模型)
  • 该解决方案基于一个复杂的 DNN,它是 ICR 竞赛获胜方案。当我看到它时就很喜欢,一直在等待一个可以应用它的竞赛。
  • 使用 IterativeImputer 类作为填补缺失值的策略,该类基于其他特征对每个缺失值的特征进行建模,并使用该估计值进行填补。我决定使用训练数据和测试数据进行拟合,并在线训练模型,以便可以利用私有测试集的数据。
  • 从活动记录数据中提取 enmo,区分工作日和周末,并按天和时间段进行分组。
  • 使用所有数据进行训练
  • 在损失函数中使用权重来平衡类别
  • 对同一模型使用 10 个不同种子的预测结果取平均

非常感谢本次竞赛的组织者以及所有分享想法和代码的参与者!

这里我分享我的解决方案代码。

同比赛其他方案