返回列表

17th Solution [3d part] and Kaggle Issue Report

499. UW-Madison GI Tract Image Segmentation | uw-madison-gi-tract-image-segmentation

开始: 2022-04-14 结束: 2022-07-14 医学影像分析 数据算法赛
第17名解决方案 [3D部分] 及 Kaggle 问题报告

第17名解决方案 [3D部分] 及 Kaggle 问题报告

作者:Leon (Grandmaster) | 比赛排名:第17名

首先,感谢我的队友 @ammarali32@jaafarmahmoud1,他们是非常棒的伙伴,让我们在公开排行榜上一直保持在顶尖位置直到最后。我相信我们只是差了一点运气没能拿到金牌。

感谢 Kaggle 和主办方举办这场精彩的比赛,我将在本讨论中总结我们解决方案中我负责的部分,并报告一个关于 Notebook 比赛中潜在的 Kaggle 问题。

概要:

在所有数据上训练 nnunet 并进行 5 折交叉验证。

框架:

nnunet

预处理:

参考了 3D Solution with MONAI [produce 3d data],感谢 @yiheng

训练

遵循 说明,但修改了 batchsize=4,epochs=1500 以及一些学习率调整。使用这些设置,在所有数据上训练的模型可以达到 0.881 的分数,而 5 折集成在没有 TTA 或任何后处理的情况下可以达到 0.885。集成所有 6 个模型(全部数据+5折)可以达到 0.887。(所有数字基于公开排行榜)。

推理 [仅 3D 部分]:

nnunet inference

集成:

我们使用了 2.5d 和 3d 预测结果的并集。

潜在的 Kaggle 代码竞赛 Notebook 超时问题 @addisonhoward

问题是:即使使用相同的代码,根据提交时间的不同,有些提交会通过,有些则可能不会。这个问题在这里这里被提及。

根据我们的经验(在经历了十几次 Notebook 超时后),我们发现 EST 时间晚上 10 点到早上 6 点是提交的好时机。在这个时间段提交时,我们没有遇到任何问题(不保证)。我们认为这是因为白天人们提交时有高峰和低谷。我们希望总是能在这个时间段提交,但那个时间段对我来说是深夜。

在比赛的最后一天,我们对代码进行了一些修改,并在 EST 时间上午 10 点提交,我们希望将其选为最终结果之一。它本应在约 8 小时 20 分钟内通过。然而,依然出现了 Notebook 超时。

对于代码竞赛和 9 小时的时间限制,我认为无论提交时间如何,所有提交都应被同等对待。我认为这对所有代码竞赛来说都是一个关键问题,期待收到 Kaggle 团队 @addisonhoward 的回复。

同比赛其他方案