返回列表

14th Place Solution- KMS

473. PetFinder.my - Pawpularity Contest | petfinder-pawpularity-score

开始: 2021-09-23 结束: 2022-01-14 计算机视觉 数据算法赛
第14名方案 - KMS

第14名方案 - KMS

作者:khyeh (Grandmaster) | 比赛排名:第14名

感谢比赛主办方举办这次比赛,也感谢 @mcggood@shivamb 的出色工作!

解决方案

概述:融合了多种基于特征提取和微调的模型,模型的多样性和图像尺寸的多样性是关键。

基于特征提取的模型:

  • tf_efficientnet_l2_ns + 图像尺寸 1024 + 岭回归: CV分数 17.68

基于微调的模型:(均使用了重度数据增强)

  • tf_efficientnet_b4_ns + 图像尺寸 384: CV分数 17.79
  • vit_large_patch16_384+ 图像尺寸 384: CV分数 17.63
  • beit_large_patch16_512+ 图像尺寸 512: CV分数 17.59
  • swin_large_patch4_window7_224 + 图像尺寸 224: CV分数 17.49
  • swin_large_patch4_window12_384+ 图像尺寸 384: CV分数 17.48

模型融合:

最终集成模型 CV分数: 17.144

尝试过但未生效的方法

  1. 从 MaskRCNN 提取更多图像元特征(例如宠物数量、它们占据的区域比例等)。
  2. 使用以往比赛的数据(用于预训练或伪标签)。
  3. 以宠物为中心的裁剪或一次随机裁剪 N 只宠物:虽然单模型 CV 分数提高了 0.2,但对模型集成没有帮助。
同比赛其他方案