第46名解决方案

第46名解决方案 (Item2Vec/Transformer)

作者： nadare (Master) | 比赛排名： 第46名

简介

感谢 H&M、Kaggle 以及我的竞争对手们带来了这场激动人心的比赛。这篇文章是对我解决方案的简要总结。由于是通过谷歌翻译翻译成英文的，我想可能有一些地方连接不畅，如果您有任何问题，请随时提问。

这次，我使用神经网络设计了双塔模型（2-tower model）。双塔模型通过两个部分提供高性能推荐：使用轻量级模型筛选候选者的检索部分，以及使用高精度模型进行预测的排序部分。具体来说，预测/学习的流程如下。

第一阶段（检索部分） 公开榜：0.02137 私有榜：0.02296
使用 Item2Vec 缩小预测日期前后出现的文章数量的排名范围。(1)
基于规则提取过去有历史记录且最近与其他用户有互动的项目。(2)
第二阶段（排序部分） 公开榜：0.2779 私有榜：0.02846
使用 Transformer 对 (1) 和 (2) 进行重排序。

模型将在以下三个部分进行说明。

在嵌入部分，预计算的图像/自然语言模型嵌入与使用 gensim 的 word2vec 初始化的类别嵌入通过 DCNV2 混合。各嵌入的获取方式如下。

图像
- swin_large_patch4_window12_384_in22k + TruncatedSVD (1024 维)
- EfficientNetV2L + TruncatedSVD (1024 维)
自然语言
- ELECTRA LARGE（通过拼接 detail_desc 和 category name 输入）
- Sentence-T5 st5-11b（通过拼接 detail_desc 和 category name 输入）
- BERT Tokenizer + Tf-Idf + PCA (128 维)
类别
通过 gensim 实现的 Word2vec
表格数据
- 价格
- 总数量（同一天相同产品合并为一条记录）
- 该用户的互动次数
- 与其他日期相比的价格统计