我们的解决方案是一个由不同输入尺寸的yolov8m-seg模型组成的集成:512、640、1024。我们使用"unknown"和"glomerulus"作为血管对模型进行预训练,因为它们与目标具有相似的结构。然后,我们使用正确的血管标签重新训练模型,不再包含任何"unknown"或"glomerulus"标签。
对于测试时增强(TTA),我们使用了旋转(90度)、水平翻转、垂直翻转和对角翻转。此外,我们将像素阈值降低到0.45,让模型决定在哪里以及如何扩张。然而,仅靠降低阈值在公开排行榜上的表现不如扩张操作,因此我们保留了扩张。
为了集成掩码,我们使用了来自https://www.kaggle.com/code/mistag/sartorius-tta-with-weighted-segments-fusion的代码。
我们还利用DBSCAN裁剪主要预测所在位置的图像。这项技术曾在image_matching comp 2022中使用。其目的是利用预测的置信度来微调预测掩码(随机裁剪也应该有效)。
此外,我们使用SAM对预测掩码进行了微调。
未奏效的方法:
- 缩放的TTA完全不起作用。
- 使用staintools进行归一化在公开排行榜上效果不佳(导致约0.008的下降),但在私有排行榜上有效(提升了+0.01)。我们最好的私有分数是0.561,是由yolox(512) + yolom(1024)集成得到的,像素阈值为0.45,不使用扩张。
