返回列表

17th Place Solution

473. PetFinder.my - Pawpularity Contest | petfinder-pawpularity-score

开始: 2021-09-23 结束: 2022-01-14 计算机视觉 数据算法赛
第17名方案

第17名方案

作者: Kelvin (Grandmaster) | 比赛排名: 第17名 | 发布时间: 2022-01-15

摘要

我们最终的提交由 (10个 PyTorch 模型)*0.7 + (1个 FastAI 模型)*0.3 组成。(10个 PyTorch 模型) 使用 5 折交叉验证训练,(1个 FastAI 模型) 使用 8 折交叉验证训练。所有模型都使用之前的 "PetFinder Adoption Speed data" 竞赛数据集进行伪标签训练。我们对 (10个 PyTorch 模型) 使用了简单的平均法。

模型集成

我们的集成模型还包括一些仅在 "猫" 和 "狗" 图像上训练的模型,将这些单独训练的猫模型和狗模型结合起来,CV(交叉验证分数)和 LB(排行榜分数)都有轻微的提升。其基本原理是 "猫" 比 "狗" 更容易预测,因此我们更侧重于改进单独的狗模型。因此我们也把这些模型包含在了集成中。我们只使用了两种 TTA(测试时增强):1. "CenterCrop"(中心裁剪)2. "CenterCrop + HFlip"(中心裁剪 + 水平翻转),使用其他 TTA 反而降低了我们的 CV 分数。

模型详情

所有模型均使用 BCE 损失函数训练,不同模型间的增强配置略有不同,包括 "HFlip"(水平翻转)、"ColorJitter"(颜色抖动)、"CenterCrop"(中心裁剪)、"RandomResizedCrop"(随机调整大小裁剪)、"ToGray"(转灰度)、"ShiftScaleRotate"(平移缩放旋转)、"IAASharpen"(锐化)和 "MixUp"(混合)。我们发现,即使使用相同的架构,这种方法也能提高模型的多样性。

模型 CV Public Private 备注
swin_large_patch4_window7_224_in22k 16.5 17.87 17 外部数据
ig_resnext101_32x8d 17.14 18.04 17.08 外部数据
ig_resnext101_32x8d (x2) 17.1 18.06 17.06 外部数据 (仅猫 + 仅狗模型)
vit_large_patch16_224_in21k (x2) 17 18.04 17.22 外部数据 (仅猫 + 仅狗模型)
tf_efficientnet_b4_ns (x2) 16.98 18.09 17.2 外部数据 (仅猫 + 仅狗模型)
swin_large_patch4_window7_224_in22k 17.04 18 17.07 外部数据
tf_efficientnet_b4_ns 17.07 18.03 17.1 外部数据
vit_large_patch16_224_in21k 17.08 17.96 17.07 外部数据
swin_large_patch4_window12_384_in22k 16.99 17.99 17.04 外部数据
ig_resnext101_32x8d 17.06 17.98 17.1 外部数据