返回列表

16th place solution [0.988 private LB]

339. Recursion Cellular Image Classification | recursion-cellular-image-classification

开始: 2019-06-27 结束: 2019-09-26 药物研发 数据算法赛
第16名方案 [Private LB 0.988]

第16名方案 [Private LB 0.988]

作者: RabotniKuma (Grandmaster)
比赛排名: 第16名

首先,我要感谢 Recursion Pharmaceuticals 和 Kaggle 组织了如此有趣的比赛。然后,我非常感谢 nosoundGiulia Savorgnan 报告了平板泄漏问题。

我的方案非常简单。概览如上图所示。(抱歉我的字迹潦草..

环境设置

  • 我使用了配备 V100 GPU 的云实例。
  • 使用 PyTorch 框架。

数据

  • 6 通道,512x512 输入。
  • 对部分模型应用了对比度受限的自适应直方图均衡化(CLAHE)。
  • 常规的数据增强。

模型

  • 主要使用带有各种骨干网络的 CosFace。
  • 使用 RAdam 优化器和循环学习率。
  • 每个站点分开处理。
  • 采用此讨论中的两阶段训练方法。
  • 在第二阶段训练中进行交叉验证。

预测

  • 不使用 model.eval()(这是由于每个实验之间的差异)。
  • 对每张图像进行 8 次测试时增强(TTA)。
  • 对来自两个站点的预测结果取平均值。
  • 软投票。

后处理

  • 此 Kernel相同的方式修正原始预测。
  • 使用匈牙利算法去除每个平板中的重复预测。

无效尝试

  • Mixup 数据增强。
  • 对照图像(我尝试了一个双头模型,其中实验图像特征减去对照图像特征,但效果更差)。

我真的很想尝试伪标签,这可能会提高分数,但由于时间不足,我没来得及做。

最后,祝贺获奖者!

P.S.
我在 Aillis Inc. 工作,这是一家日本医疗设备初创公司,利用喉咙图像开发先进的诊断设备。我们正在招聘!如果你感兴趣,请联系我。

同比赛其他方案