600. HMS - Harmful Brain Activity Classification | hms-harmful-brain-activity-classification
1D模型主要基于Wavenet,并使用注意力池化。首先在所有投票数据上训练,然后在投票数≥10的部分上训练。获得较好的模型后,进行伪标签预训练。
数据增强:
2D频谱图解决方案采用两阶段训练:
数据准备与预处理
使用Kaggle频谱图+EEG频谱图
每个eeg_id仅生成一个样本,数据从中间位置截取
EEG频谱图生成方法:梅尔频谱图
K折交叉验证: 5折,按患者分组
数据增强:
模型:
训练细节:
这样做的原因是注意到1D模型和2D模型的梯度变化差异很大(最大差异达1e10倍),同时1D和2D模型拟合所需的学习率变化也不同(差异在1e10-1e100量级),因此采用了分别训练的思路。
同时,对1D模型进行了一些改进。我们对EEG波形进行切片,例如10000→2000*5,然后在每个2000长度上分别进行卷积操作,而不是在整个10000长度上卷积,这带来了一定的性能提升。
测试时增强(TTA)
我们对大量模型使用TTA,以尽可能提升每个模型的性能。
排序Kaggle频谱图
Kaggle频谱图四个通道的顺序为['LL','RL','LP','RP'],而EEG的顺序是['LL','LP','RP','RR'],因此在一些模型中我们尝试重新排列Kaggle频谱图,使其与EEG的通道顺序保持一致。