642. CIBMTR - Equity in post-HCT Survival Predictions | equity-post-HCT-survival-predictions
鉴于本次比赛与 Tabular Playground Series 比赛的相似性,且我和队友都是经验丰富的 TPS 参与者并取得过成功,我们决定将我们在合成表格数据集方面的知识应用于本次比赛。
TL;DR:大型集成模型,极简特征工程,外加一些额外技巧。
在三个月的时间里,我们训练了大量的模型库并尝试了各种集成技术。比赛结束时,我们总共积累了 98 个模型,这些模型基于各种不同的目标变换训练而成。鉴于基础模型数量庞大,我们还在集成过程中进行了特征选择,以减少模型数量并提高 CV 分数。
我们的最终方法包含一个多层集成:
下面,我们提供所有基础模型和集成模型的 CV 分数。

我们要感谢组织者举办了一场有趣的比赛,也要感谢所有分享见解和想法的人,特别是 @ambrosm、@adaubas、@andreasbis 和 @mtinti。
个人而言,我想祝贺并大大感谢我的队友 @rzatemizel。这是我们的第一枚比赛奖牌,我无法要求更好的合作伙伴了!