Public LB 37 and privateLB 10
Public LB 37 名与 Private LB 第 10 名
作者:Raghawendra Singh (MASTER)
发布时间:2019-06-21
我的模型非常简单,仅使用了 GMM(高斯混合模型)和 QDA(二次判别分析)。
- 移除了所有方差小于 2 的无关特征。
- 进一步移除了所有与目标的皮尔逊相关系数小于 0.010 的特征。
- 训练了一个包含 6 个聚类(每个类别 3 个)的 GMM 模型。
- 将 6 个预测概率作为下一个分类器(步骤 6 中提到的)的特征。
- 使用 QDA 分类器对 GMM 获得的 6 个标签进行分类,并将其预测概率作为另外 6 个特征。
- 使用另一个 QDA 分类器,利用上述 12 个特征来预测目标类别。
- 对该模型进行了 3 次迭代训练,在第 2 和第 3 次迭代中,利用上一次迭代的 OOF(Out-of-Fold)预测结果,反转了 90% 被错误分类目标的标签。伪标签会降低我的分数,所以我没有使用它。