4th place solution

473. PetFinder.my - Pawpularity Contest | petfinder-pawpularity-score

开始: 2021-09-23 结束: 2022-01-14 计算机视觉数据算法赛

第4名解决方案

作者：ishikei, ONODERA, fam_taro
比赛排名：第4名

解决方案概述

我们解决方案的重点是使用 pet1 元数据进行后处理。

图像模型
- 8个模型集成（简单平均）
表格模型
- 在 pet1 表格数据上训练 XGBoost，并将预测结果与图像模型的预测结果混合。
- 如果 pet1 train ∧ pet2：使用 AdoptionSpeed 进行训练和推理
- 如果 pet1 test ∧ pet2：不使用 AdoptionSpeed 进行训练和推理

验证

本次比赛的数据中存在若干重复的图像对。因此，我们将这些图像对包含在同一个折中。（10折交叉验证）

预处理

为了使其看起来像 petfinder 网站上的缩略图视图，我裁剪了图像的长边，然后将其调整为所需的分辨率。

模型

图像模型

8个模型集成（简单平均）
所有模型均使用 BCE（二元交叉熵）损失进行训练。
此外，部分模型分别针对猫和狗进行了创建。
使用以往比赛数据进行伪标记（pseudo_label）持续改善了 CV。在此过程中，我为每个折创建了单独的伪标记，以防止标签泄漏。[参考链接]

模型	是否区分猫狗	是否使用伪标记	CV分数
swin_large_patch4_window12_384	✓		17.3495
swin_large_patch4_window7_224	✓		17.4379
vit_large_patch16_384	✓		17.6727
swin_large_patch4_window12_384		✓	17.1648
swsl_resnext101_32x8d		✓	17.2754
swsl_resnext101_32x8d			17.6335
vit_huge (ImageNet MAE pretrained)			17.7407
ConvNeXt_xlarge		✓	17.1516

--> 8个模型平均：CV=17.0058

表格模型

在 pet1 表格数据上训练 XGBoost，并将预测结果与图像模型的预测结果混合。
- 如果 pet1 train ∧ pet2：使用 AdoptionSpeed 进行训练和推理
- 如果 pet1 test ∧ pet2：不使用 AdoptionSpeed 进行训练和推理
在与图像模型预测结果混合时，分别在 [0.1 - 0.9] 范围内扫描 pet1(train) 和 pet1(test) 的表格模型预测混合比例，以找到能获得最佳 RMSE 的混合比例。

pet2 之前 CV(全部): 17.0058
----
pet1(train) ∧ pet2 图像 CV



        
        
            
                同比赛其他方案
            
            
                
                
                    
                        
                            1st Place - Winning Solution - Placeholder
                        
                    
                
                
                
                    
                        
                            Tentative 2nd place solution
                        
                    
                
                
                
                    
                        
                            3rd place Solution
                        
                    
                
                
                
                    
                        
                            [Public 1st/ Private 5th] Solution Overview
                        
                    
                
                
                
                    
                        
                            6th Place - Multitask Learning