473. PetFinder.my - Pawpularity Contest | petfinder-pawpularity-score
大家好,
祝贺 @titericz!这是我们的简要解决方案说明。我们将公开所有的代码和数据集。如果有任何问题,请在此主题下留言。
更新: 我们的代码在这里!
https://www.kaggle.com/ktakita/team-merged-ensemble-fixednewmodelsexp029nonmean
我们主要使用了 Swin Transformer,这在顶级内核中也被广泛使用。我只是使用了在许多公共内核中出现的 fastai 流程。以下是我的模型和集成权重。然后,我们将每个成员的模型进行集成。
| 模型 | 损失函数 | 权重 |
|---|---|---|
| convnext_large | BCE | 0.107571 |
| cait_m36_384 | BCE | 0.086765 |
| vit_base_patch16_224_miil_in21k | Poisson | 0.084596 |
| cait_m36_384 | 100-class CE | 0.076999 |
| xcit_small_24_p16_384_dist | BCE | 0.076158 |
| xcit_small_24_p8_384_dist | BCE | 0.073455 |
| crossvit_18_dagger_408 | BCE | 0.072553 |
| swin_large_patch4_window12_384_in22k | BCE | 0.072102 |
| vit_base_patch16_224_miil_in21k | BCE | 0.071953 |
| vit_base_r50_s16_384 | BCE | 0.058601 |
| swin_base_patch4_window12_384 | BCE | 0.057393 |
| vit_base_patch16_224_miil_in21k | MSE | 0.056347 |
| jx_nest_base | BCE | 0.055556 |
| vit_large_patch16_224 | Poisson | 0.054602 |
@ktakita 和 @teyosan1229 的部分如下:
我们使用了以下三种类型的数据:
①图像数据
T.Resize(image_size)
T.CenterCrop([image_size, image_size])
②One hot 数据
'Subject Focus', 'Eyes', 'Face', 'Near', 'Action', 'Accessory',
'Group', 'Collage', 'Human', 'Occlusion', 'Info', 'Blur'
③图像形状
'height', 'width', 'aspect'
对于模型,我们通过 Ridge 回归集成了以下 6 个模型。
swin_large_patch4_window12_384
使用数据:①
图像尺寸:384
损失函数:nn.BCEWithLogitsLoss
poolformer_m36
使用数据:①, ②
图像尺寸:224
损失函数:BCEWithLogitsLossFlat
swin_large_patch4_window7_224_in22k
使用数据:①, ②, ③
图像尺寸:224
损失函数:BCEWithLogitsLossFlat
swin_large_patch4_window12_384
使用数据:①
图