返回列表

Tentative 2nd place solution

473. PetFinder.my - Pawpularity Contest | petfinder-pawpularity-score

开始: 2021-09-23 结束: 2022-01-14 计算机视觉 数据算法赛
暂定第二名方案

暂定第二名方案

作者: tkm2261 (Grandmaster), ktakita (Master), teyosan1229 (Master)
发布时间: 2022年1月15日

大家好,
祝贺 @titericz!这是我们的简要解决方案说明。我们将公开所有的代码和数据集。如果有任何问题,请在此主题下留言。

更新: 我们的代码在这里!
https://www.kaggle.com/ktakita/team-merged-ensemble-fixednewmodelsexp029nonmean

模型

我们主要使用了 Swin Transformer,这在顶级内核中也被广泛使用。我只是使用了在许多公共内核中出现的 fastai 流程。以下是我的模型和集成权重。然后,我们将每个成员的模型进行集成。

模型 损失函数 权重
convnext_largeBCE0.107571
cait_m36_384BCE0.086765
vit_base_patch16_224_miil_in21kPoisson0.084596
cait_m36_384100-class CE0.076999
xcit_small_24_p16_384_distBCE0.076158
xcit_small_24_p8_384_distBCE0.073455
crossvit_18_dagger_408BCE0.072553
swin_large_patch4_window12_384_in22kBCE0.072102
vit_base_patch16_224_miil_in21kBCE0.071953
vit_base_r50_s16_384BCE0.058601
swin_base_patch4_window12_384BCE0.057393
vit_base_patch16_224_miil_in21kMSE0.056347
jx_nest_baseBCE0.055556
vit_large_patch16_224Poisson0.054602

@ktakita@teyosan1229 的部分如下:

我们使用了以下三种类型的数据:
①图像数据
T.Resize(image_size)
T.CenterCrop([image_size, image_size])
②One hot 数据
'Subject Focus', 'Eyes', 'Face', 'Near', 'Action', 'Accessory',
'Group', 'Collage', 'Human', 'Occlusion', 'Info', 'Blur'
③图像形状
'height', 'width', 'aspect'

对于模型,我们通过 Ridge 回归集成了以下 6 个模型。

  • swin_large_patch4_window12_384
    使用数据:①
    图像尺寸:384
    损失函数:nn.BCEWithLogitsLoss

  • poolformer_m36
    使用数据:①, ②
    图像尺寸:224
    损失函数:BCEWithLogitsLossFlat

  • swin_large_patch4_window7_224_in22k
    使用数据:①, ②, ③
    图像尺寸:224
    损失函数:BCEWithLogitsLossFlat

  • swin_large_patch4_window12_384
    使用数据:①

同比赛其他方案