返回列表

2nd place solution

627. Playground Series - Season 4, Episode 10 | playground-series-s4e10

开始: 2024-09-30 结束: 2024-10-31 信贷风控 数据算法赛
第二名解决方案

第二名解决方案

作者: OMID BAGHCHEH SARAEI
发布时间: 2024-11-01
竞赛排名: 第 2 名

大家好,

首先,我要感谢 siukeitin 富有洞察力的帖子和评论。他的 Grandmaster 头衔实至名归,我从他的工作中学到了很多。其次,我要感谢 paddykb,他在 notebook 中创新地将所有特征视为类别的方法,被证明是本次比赛的关键转折点。他的优秀 notebook (PS s4e10 - No Keras, No Loan (cv 0.963)) 也为我集成模型的多样性做出了贡献。

老实说,我不是专家级数据科学家。考虑到有许多才华横溢的参与者,能获得第二名让我感到惊讶。顺便说一下,我的方法相对简单,你可以在 这里 看到我的 notebook。

总之,我没有选择我最好的 LB 分数 0.97350(CV 为 0.96954)。我的最终提交如下:

  1. CV(5 折)=0.97107, LB= 0.97217 (21 个模型)
  2. CV(5 折)=0.97026, LB= 0.97335 (24 个模型)

为了达到这个结果,我使用了原始数据集,并在少数模型中做了一点特征工程(添加新特征)以增加多样性。
下面的截图来自我的 notebook。

Untitled.png Untitled2.png newplot.png

祝大家一切顺利,

OMID BAGHCHEH SARAEI

同比赛其他方案