627. Playground Series - Season 4, Episode 10 | playground-series-s4e10
大家好,
首先,我要感谢 siukeitin 富有洞察力的帖子和评论。他的 Grandmaster 头衔实至名归,我从他的工作中学到了很多。其次,我要感谢 paddykb,他在 notebook 中创新地将所有特征视为类别的方法,被证明是本次比赛的关键转折点。他的优秀 notebook (PS s4e10 - No Keras, No Loan (cv 0.963)) 也为我集成模型的多样性做出了贡献。
老实说,我不是专家级数据科学家。考虑到有许多才华横溢的参与者,能获得第二名让我感到惊讶。顺便说一下,我的方法相对简单,你可以在 这里 看到我的 notebook。
总之,我没有选择我最好的 LB 分数 0.97350(CV 为 0.96954)。我的最终提交如下:
为了达到这个结果,我使用了原始数据集,并在少数模型中做了一点特征工程(添加新特征)以增加多样性。
下面的截图来自我的 notebook。
祝大家一切顺利,
OMID BAGHCHEH SARAEI