Private 47th solution

我们的解决方案是一个由不同输入尺寸的yolov8m-seg模型组成的集成：512、640、1024。我们使用"unknown"和"glomerulus"作为血管对模型进行预训练，因为它们与目标具有相似的结构。然后，我们使用正确的血管标签重新训练模型，不再包含任何"unknown"或"glomerulus"标签。

对于测试时增强（TTA），我们使用了旋转（90度）、水平翻转、垂直翻转和对角翻转。此外，我们将像素阈值降低到0.45，让模型决定在哪里以及如何扩张。然而，仅靠降低阈值在公开排行榜上的表现不如扩张操作，因此我们保留了扩张。

为了集成掩码，我们使用了来自https://www.kaggle.com/code/mistag/sartorius-tta-with-weighted-segments-fusion的代码。

我们还利用DBSCAN裁剪主要预测所在位置的图像。这项技术曾在image_matching comp 2022中使用。其目的是利用预测的置信度来微调预测掩码（随机裁剪也应该有效）。

此外，我们使用SAM对预测掩码进行了微调。

未奏效的方法：

缩放的TTA完全不起作用。
使用staintools进行归一化在公开排行榜上效果不佳（导致约0.008的下降），但在私有排行榜上有效（提升了+0.01）。我们最好的私有分数是0.561，是由yolox(512) + yolom(1024)集成得到的，像素阈值为0.45，不使用扩张。

结果图片

第47名私有方案

相关链接

同比赛其他方案