17th Place Solution

第17名方案

作者： Kelvin (Grandmaster) | 比赛排名： 第17名 | 发布时间： 2022-01-15

摘要

我们最终的提交由 (10个 PyTorch 模型)*0.7 + (1个 FastAI 模型)*0.3 组成。(10个 PyTorch 模型) 使用 5 折交叉验证训练，(1个 FastAI 模型) 使用 8 折交叉验证训练。所有模型都使用之前的 "PetFinder Adoption Speed data" 竞赛数据集进行伪标签训练。我们对 (10个 PyTorch 模型) 使用了简单的平均法。

模型集成

我们的集成模型还包括一些仅在 "猫" 和 "狗" 图像上训练的模型，将这些单独训练的猫模型和狗模型结合起来，CV（交叉验证分数）和 LB（排行榜分数）都有轻微的提升。其基本原理是 "猫" 比 "狗" 更容易预测，因此我们更侧重于改进单独的狗模型。因此我们也把这些模型包含在了集成中。我们只使用了两种 TTA（测试时增强）：1. "CenterCrop"（中心裁剪） 和 2. "CenterCrop + HFlip"（中心裁剪 + 水平翻转），使用其他 TTA 反而降低了我们的 CV 分数。

模型详情

所有模型均使用 BCE 损失函数训练，不同模型间的增强配置略有不同，包括 "HFlip"（水平翻转）、"ColorJitter"（颜色抖动）、"CenterCrop"（中心裁剪）、"RandomResizedCrop"（随机调整大小裁剪）、"ToGray"（转灰度）、"ShiftScaleRotate"（平移缩放旋转）、"IAASharpen"（锐化）和 "MixUp"（混合）。我们发现，即使使用相同的架构，这种方法也能提高模型的多样性。

模型	CV	Public	Private	备注
swin_large_patch4_window7_224_in22k	16.5	17.87	17	外部数据
ig_resnext101_32x8d	17.14	18.04	17.08	外部数据
ig_resnext101_32x8d (x2)	17.1	18.06	17.06	外部数据 (仅猫 + 仅狗模型)
vit_large_patch16_224_in21k (x2)	17	18.04	17.22	外部数据 (仅猫 + 仅狗模型)
tf_efficientnet_b4_ns (x2)	16.98	18.09	17.2	外部数据 (仅猫 + 仅狗模型)
swin_large_patch4_window7_224_in22k	17.04	18	17.07	外部数据
tf_efficientnet_b4_ns	17.07	18.03	17.1	外部数据
vit_large_patch16_224_in21k	17.08	17.96	17.07	外部数据
swin_large_patch4_window12_384_in22k	16.99	17.99	17.04	外部数据
ig_resnext101_32x8d	17.06	17.98	17.1	外部数据
同比赛其他方案 1st Place - Winning Solution - Placeholder Tentative 2nd place solution 3rd place Solution 4th place solution [Public 1st/ Private 5th] Solution Overview

第17名方案

摘要

模型集成

模型详情

同比赛其他方案