返回列表

18th place solution

378. University of Liverpool - Ion Switching | liverpool-ion-switching

开始: 2020-02-24 结束: 2020-05-25 药物研发 数据算法赛
第18名方案

第18名方案

作者:ITK8191 | 排名:第18名(银牌)

我是一个幸运的人,我获得了第18名和一枚银牌。我的方案只是对公开的 WaveNet notebook 进行了轻微的修改。

特征工程

我使用了 @cdeotte 的“无漂移数据”。

共使用了42个特征,包括3个滞后特征(与 @siavrez 的 WaveNet notebook 一致),基于 @ragnar123 notebook 的 signal**2 和 signal**4 特征,基于 @martxelo notebook 的梯度、低通和高通滤波器,以及添加了 @sggpls 的 ION-SHIFTED-RFC-PROBA。

网络架构

将卷积基滤波器数量从16个更改为24个(1.5倍),并添加了3个LSTM层。

网络架构图

数据增强策略及其他

我对特征进行了归一化,对所有特征添加了 np.random.normal(loc=0, scale=0.01) 噪声,并将数据翻转三次,使训练数据量变为原来的8倍。

GROUP BATCH SIZE(每个样本的信号数)确定为6250时效果最佳。

训练

训练进行了两次。第一次正常优化损失。第二次,我将L2权重正则化因子从0改为0.0001,学习率设为1e-5,并优化准确率。

预测

预测阶段也进行了增强。我对所有特征添加了 np.random.normal(loc=0, scale=0.001) 噪声,并将数据翻转4次,即对测试数据预测了10次。

此外,我将 GROUP BATCH SIZE 从6250改为500000进行了13次预测并取平均值,然后使用 argmax。

最终的 OOF CV 分数为 0.942421。

再次重申,我只是个幸运儿。精彩的讨论和 notebook 分享让我赢得了奖牌。没有这些,我的分数将是0。感谢那些分享见解的人。

同比赛其他方案