返回列表

Third (3rd) Place solution (Technique that worked out and Lessons learnt so far)

441. Tabular Playground Series - May 2021 | tabular-playground-series-may-2021

开始: 2021-05-01 结束: 2021-05-31 商品理解 数据算法赛
第三名方案(行之有效的技术与经验教训)

再次衷心祝贺所有的获胜者。

行之有效的技术

  • 首先,从比赛开始到结束,我拒绝使用任何来自所谓“预训练模型”的预测结果(提交文件)进行集成。
  • 其次,我只关注那些在预测中“Class_2”占比较高(被高度看好)的提交文件。
  • 第三,我只挑选了其中最好的三个同样看好“Class_2”的提交文件。
  • 最后,就是集成技术了。我只对这三个提交文件进行了集成,最终成绩分别为:Public LB 1.08514 和 Private LB 1.08769。

自 Tabular Playground Series 开始以来学到的重要教训

  • 在我们实施的模型产生的众多预测中,隐藏着出色且非常好的预测(提交文件)。但这需要我们运用直觉去发掘这些预测。

  • 感谢 Kaggle 通过每月的“Tabular Playground Series”教会我们如何做出正确的决策,特别是在现实生活场景中,一个人应该对哪种模型在生产过程中会表现更好拥有直觉。

  • 在这类比赛中,最重要的事情是学习、再学习、重新学习,以便做出非常具体和有价值的决定,这也有助于培养现实世界部署所需的良好直觉。

  • 归根结底,比赛应该让我们为现实世界的部署培养良好的直觉,而不是依赖那些在现实世界中无法泛化的做法。

同比赛其他方案