返回列表

8th place solution

434. Human Protein Atlas - Single Cell Classification | hpa-single-cell-image-classification

开始: 2021-01-26 结束: 2021-05-11 生命科学 数据算法赛
第8名解决方案

第8名解决方案

作者:Guanshuo Xu
比赛排名:第8名

由于我们获得了图像级别的标签和细胞分割结果,我们可以直接利用图像标签进行训练,并直接预测细胞标签。

假设在训练过程中,我们采样 B 张图像,在每张图像中采样 M 个细胞。进一步假设输入通道数=4,输入尺寸=256x256,特征维度=2048。

  1. CNNs 的输入形状 -> BMx4x256x256
  2. CNN 特征提取 -> BMx2048x8x8
  3. GAP (全局平均池化) -> BMx2048
  4. 重塑和置换 -> Bx2048xM
  5. 另一个 GAP (全局平均池化) -> Bx2048
  6. 最后的线性层 -> Bx18 (与图像标签计算损失)

在推理阶段,为了预测细胞标签,我们去掉了第4步和第5步:

  1. CNNs 的输入形状 -> BMx4x256x256
  2. CNN 特征提取 -> BMx2048x8x8
  3. GAP (全局平均池化) -> BMx2048
  4. 最后的线性层 -> BMx18 (细胞标签预测完成)

这种方法部分受到了 lafoss concat tile pooling 和类激活映射的启发。

带来一些提升的后处理步骤,按重要性大致排序如下:

  1. 降低边缘细胞的预测权重。
  2. 使用交叉验证 (CV) 中的 OOF (Out-of-Fold) 预测进行细胞级别的微调。
  3. 0.9x细胞预测 + 0.1x图像内平均细胞预测,以利用图像内的标签相关性。虽然训练一些独立的图像级模型可能会更好 示例。在这里我只是复用了细胞预测结果。
同比赛其他方案