返回列表

2nd Place Solution

402. OpenVaccine: COVID-19 mRNA Vaccine Degradation Prediction | stanford-covid-vaccine

开始: 2020-09-11 结束: 2020-10-06 药物研发 数据算法赛
第二名解决方案

第二名解决方案

作者:ONODERA, KF | 排名:第 2 名

我本来是按照第一名的方案来准备的,但不幸的是我又一次拿到了第 5 名(实际上是第二名)。到底是谁施的诅咒???

LB 进度

LB Progress

流程

Pipeline

我对 SN_filter 和伪标签进行了预测,但除此之外,这几乎与我在 TReNDS 比赛中的第二名方案使用的方法论相同。

堆叠

我非常擅长使用 XGBoost 进行堆叠。然而,由于剧烈的 OOF 变化,使用伪标签模型的 OOF 进行堆叠有点困难。所以我尝试向 OOF 和测试预测中添加高斯噪声,随后我成功避免了过拟合。

Stacking 1 Stacking 2

CV 与 LB

此外,我们的 CV 和 LB 具有超强的相关性。我们可以完全通过 CV 分数来预测 LB 分数,所以我们没有进行太多的提交。

LB 模拟

现在我认为这项工作起了作用:

LB Simulation

参考链接:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189196#1040074

同比赛其他方案