508. HuBMAP + HPA - Hacking the Human Body | hubmap-organ-segmentation
首先,我们要感谢乌克兰武装部队、乌克兰安全局、乌克兰国防情报局、乌克兰国家紧急服务局提供的安全保障,使我们能够参加这项伟大的比赛,完成这项工作,并帮助科学、技术和商业不停滞不前,继续向前发展。
还要感谢我的队友 (@sakvaua , @igorkrashenyi, @alexkirnas)、Kaggle 团队和比赛组织者举办今年的 HuBMAP + HPA 活动。为了给生物医学领域带来利益而竞争是一种极大的荣幸!
根据主办方所述,主要的挑战是:
使模型在面对使用不同协议准备的数据时能够正常运行,将是本次比赛的核心挑战之一。虽然这预计会使问题更加困难,但开发具有泛化能力的模型是这项工作的关键目标。
这确实是今年 Hacking the Human Body 的关键点 :) 所以这是我们的方法:
12476, 127, 13189, 15124, 16564, 23252, 25516, 25945, 29610,30084,30500, 31139,31571, 7359, 8151
后来我们对这些数据进行了伪标签处理,并再次添加到训练中。
"prostate": 0.15 * 2,
"spleen": 1 * 2,
"lung": 0.5 * 2,
"kidney": 1 * 2,
"largeintestine": 1 * 2,
我们使用了来自 GTEX 和 HPA 门户网站的额外数据来补充初始训练数据。这里的 GTEX 数据尤其重要,因为它的染色方式与 HuBMAP 玻片相似,都是 H&E。我们从 GTEX 下载了前列腺、大肠、肾脏和脾脏数据,针对没有明显病理的患者。我们忽略了 GTEX 的肺部数据,因为我们不知道如何分割它们(我们的模型也不知道)。我们在流程中逐步添加 GTEX 图像,到比赛结束时大约有 140 张。并用与 HPA 相同的集成模型对它们进行了伪标签处理。
从 HPA 站点,我们使用了大量 DAB 染色玻片,与组织者提供的非常相似。总的来说,我们为每个器官添加了 57-61K 张额外的 HPA 图像。