499. UW-Madison GI Tract Image Segmentation | uw-madison-gi-tract-image-segmentation
首先,感谢我的队友 @ammarali32 和 @jaafarmahmoud1,他们是非常棒的伙伴,让我们在公开排行榜上一直保持在顶尖位置直到最后。我相信我们只是差了一点运气没能拿到金牌。
感谢 Kaggle 和主办方举办这场精彩的比赛,我将在本讨论中总结我们解决方案中我负责的部分,并报告一个关于 Notebook 比赛中潜在的 Kaggle 问题。
在所有数据上训练 nnunet 并进行 5 折交叉验证。
参考了 3D Solution with MONAI [produce 3d data],感谢 @yiheng。
遵循 说明,但修改了 batchsize=4,epochs=1500 以及一些学习率调整。使用这些设置,在所有数据上训练的模型可以达到 0.881 的分数,而 5 折集成在没有 TTA 或任何后处理的情况下可以达到 0.885。集成所有 6 个模型(全部数据+5折)可以达到 0.887。(所有数字基于公开排行榜)。
我们使用了 2.5d 和 3d 预测结果的并集。
问题是:即使使用相同的代码,根据提交时间的不同,有些提交会通过,有些则可能不会。这个问题在这里和这里被提及。
根据我们的经验(在经历了十几次 Notebook 超时后),我们发现 EST 时间晚上 10 点到早上 6 点是提交的好时机。在这个时间段提交时,我们没有遇到任何问题(不保证)。我们认为这是因为白天人们提交时有高峰和低谷。我们希望总是能在这个时间段提交,但那个时间段对我来说是深夜。
在比赛的最后一天,我们对代码进行了一些修改,并在 EST 时间上午 10 点提交,我们希望将其选为最终结果之一。它本应在约 8 小时 20 分钟内通过。然而,依然出现了 Notebook 超时。
对于代码竞赛和 9 小时的时间限制,我认为无论提交时间如何,所有提交都应被同等对待。我认为这对所有代码竞赛来说都是一个关键问题,期待收到 Kaggle 团队 @addisonhoward 的回复。