返回列表

[9th] Simple and kinda stable approach

459. RSNA-MICCAI Brain Tumor Radiogenomic Classification | rsna-miccai-brain-tumor-radiogenomic-classification

开始: 2021-07-13 结束: 2021-10-15 医学影像分析 数据算法赛

[第9名] 简单且某种程度上稳定的方法

作者: Vadim Timakin (Competition Master)
比赛排名: 第9名

大家好!首先,我要感谢比赛的组织者,正是因为这次比赛,我离在17岁获得 Kaggle 比赛大师 称号的目标更近了一步。

我在上一场比赛结束两周后才开始解决这次比赛,所以我像往常一样没有时间从头开始编写我的流程。我选择了这个笔记本作为基础。我花了两周时间尝试不同的实验方法。我试图将这个问题作为分割或检测问题来解决,我采用了预训练模型并将它们的头部替换为分类头。然而,这些想法都没有产生令人满意的排行榜分数。

与此同时,我在训练 Efficientnet3D。由于我没有很多的硬件资源和时间,我使用了较小的图像尺寸——224。与往常的建模或应用增强不同,我决定花时间检查我的解决方案有多稳定。作为一个实验,我决定在不同的随机种子上运行我的解决方案10次(在 RTX 3080 上训练不到3小时),这是我第一次在比赛中做这样的事情。在进行了5次这样的训练后,交叉验证(CV)的范围等于 [0.5, 0.54],所以我中断了这个实验。距离比赛结束还有几天,我决定在更大的图像尺寸上训练模型,并以同样的方式检查这个解决方案的稳定性,所以我将图像大小从224切换到了384。这次5次训练后的 CV 范围大约是 [0.52, 0.55],我觉得这很有趣,因为这应该意味着更大的图像尺寸会产生更好的稳定性。

最后,我选择了这5次训练(每次5折)的集成作为我的最终提交。它在公共排行榜上得分 0.66701,在私人排行榜上得分 0.60186,这分别比之前的提交(基于224图像尺寸的单次训练)高出 0.07 和 0.03。也许更大的图像尺寸会产生更高且更稳定的分数,但我没有时间去训练它。我只关注验证集,根本不看排行榜,我只提交了两个验证集表现最好的解决方案,这样我就不必去选择了。

我个人感到震动的原因在于,我验证集最好的解决方案同时也是(经测试)最稳定的方案。我尽我所能让它稳定,但我清楚地明白,仅仅使用随机预测也有可能得到同样的分数。

对于那些正在解决但最终没有获得奖牌的人,首先我对你们表示极大的尊重,其次我请求你们不要难过。我知道那种感觉,我曾经花了3个月解决一场比赛,但因为嘈杂的排行榜甚至没有获得奖牌。你可以在这里查看这个解决方案。那是我在16岁时写的,当时那是最好的解决方案。

祝你们在接下来的比赛中好运,我们那里见!

同比赛其他方案