返回列表

23th Place Interesting Approach

378. University of Liverpool - Ion Switching | liverpool-ion-switching

开始: 2020-02-24 结束: 2020-05-25 药物研发 数据算法赛
第23名 有趣的方法

第23名 有趣的方法

作者:khyeh (Grandmaster) | 排名:第23名

大家好,
从比赛开始之初,在阅读了主办方的论文后,我一直在思考两种改进模型的方法。

  1. 从 1f 模型迁移学习到 3\5\10 模型 ==> 在 HMM\RF\Wavenet 上尝试失败...
  2. 从 1f 信号\open_channels 进行数据增强生成 3\5\10 信号\open_channels:基于这样的直觉,即最大 open channels 为 3 的模型应该像 3 个运行结果汇总的 1f 模型 ==> 成功

关于第二种方法:

  1. 在每个折叠(fold)中划分训练\验证集。
  2. 从 1f 模型中随机选择信号\open_channels 序列(长度=4000)。
  3. 从第 2 步中随机选取,例如 5 个序列,并将它们叠加起来创建一个最大 open channels 为 5 的样本。
  4. 对于每个叠加后的信号,根据原始数据相应的均值\方差调整其均值\方差。

我的 Wavenet 模型得分约为 CV 0.9388,LB 0.941
对 5\10 open channels 进行数据增强后,Wavenet 得分提升为 CV 0.9423,LB: 0.945

我在这里分享了我的代码:https://www.kaggle.com/khyeh0719/wavenet-with-augmentation-2
在单折单个模型(无 RFC 特征)的情况下,该代码在 Public LB 上的得分约为 0.944。

希望这种方法能被广泛用于创建信号\open_channels,而无需实际生成信号(但假设预先知道每个 open channel 状态的均值\方差 :p)

无论如何,希望你们喜欢这个方法并觉得它很有趣!感谢 Kaggle 和主办方举办了如此有趣的比赛,我真的很享受其中,最后祝贺所有的获胜者!

同比赛其他方案