532. OTTO – Multi-Objective Recommender System | otto-recommender-system
非常感谢主办方组织了这场有趣的比赛。
问题设置与我实际的工作非常接近,我很高兴学到了很多东西。
候选者的平均数量约为 1200 个。
单个 LGBMRanker : LB 0.604
9 个具有不同超参数的 LGBMRankers 集成 : LB 0.605
我通过对排序器的预测分数取平均值来进行集成。
创建了大约 200 个特征
通过 lgbm gain importance 为每个目标选择大约 100 个特征,以减少内存使用
点击 : 5%
加购 : 25%
订单 : 40%
我设置这些值是为了让我的机器能够处理训练数据(每个数据大小约为 35GB)。
我遵循了 radek 的设置。 https://www.kaggle.com/competitions/otto-recommender-system/discussion/364991
我可以得到本地验证和 LB 之间几乎完美的相关性。
为了快速迭代改进,我通过使用 5% 的数据进行训练并使用其他 10% 的数据进行评估来进行实验。
基于本地验证的消融实验。
同时涉及候选生成和重排序特征的信息已从两者中移除。
| 条件 | clicks_recall@20 | carts_recall@20 | orders_recall@20 | weighted_recall@20 |
|---|