第18名方案:基于DenseNet + RNN
第18名方案:基于DenseNet + RNN
作者: Dmitry A. Grechka
比赛排名: 第17名
首先,感谢主办方、Kaggle团队以及所有参赛的Kaggler们!
这是我第一次获得如此高的名次!我真的很高兴这三个月来的所有努力都得到了回报。像往常一样,我在这次挑战中学到了很多东西!
我的解决方案与基于拼接池化(由Iafoss提出)的主流方法有很大不同。
具体方案如下:
- 0) 通过图像哈希进行图像相似性聚类(将聚类簇分割为训练/验证集,而不是直接分割图像)。
- 1) 将整个(中等分辨率)图像旋转到任意角度,并防止裁剪问题。
- 2) 提取组织切片(256x256)。
- 3) 全局对比度归一化(针对单张图像提取的所有切片进行)。
- 4) DenseNet121 主干网络(ImageNet预训练) -> 密集特征提取器 -> 2层GRU -> 单头ISUP等级回归(logcosh损失)。
- 5) 多轮剔除“困难或标签错误”的图像,标准为MAE > 2.5。
- 6) 训练期间使用5折交叉验证(5-Fold CV),在分割训练集和验证集时保持Gleason评分频率的平衡。
- 7) 3阶段训练:
- 冻结主干网络,长切片序列(64个切片)
- 全部解冻,较短切片序列(16个切片)
- 再次冻结主干网络,长切片序列(64个切片)
- 8) 小训练批次大小为2(用于正则化效果)。