第14名方案 - KMS
第14名方案 - KMS
作者:khyeh (Grandmaster) | 比赛排名:第14名
感谢比赛主办方举办这次比赛,也感谢 @mcggood 和 @shivamb 的出色工作!
解决方案
概述:融合了多种基于特征提取和微调的模型,模型的多样性和图像尺寸的多样性是关键。
基于特征提取的模型:
- tf_efficientnet_l2_ns + 图像尺寸 1024 + 岭回归: CV分数 17.68
基于微调的模型:(均使用了重度数据增强)
- tf_efficientnet_b4_ns + 图像尺寸 384: CV分数 17.79
- vit_large_patch16_384+ 图像尺寸 384: CV分数 17.63
- beit_large_patch16_512+ 图像尺寸 512: CV分数 17.59
- swin_large_patch4_window7_224 + 图像尺寸 224: CV分数 17.49
- swin_large_patch4_window12_384+ 图像尺寸 384: CV分数 17.48
模型融合:
最终集成模型 CV分数: 17.144
尝试过但未生效的方法
- 从 MaskRCNN 提取更多图像元特征(例如宠物数量、它们占据的区域比例等)。
- 使用以往比赛的数据(用于预训练或伪标签)。
- 以宠物为中心的裁剪或一次随机裁剪 N 只宠物:虽然单模型 CV 分数提高了 0.2,但对模型集成没有帮助。