第38名解决方案：1D模型与1D+2D模型

作者：Horikita Saku 团队（TmT、Ken_Ken_Pa、BladeRunner、HB）
发布时间：2024年4月10日
获得票数：27票

摘要

1D模型主要基于Wavenet，并使用注意力池化。首先在所有投票数据上训练，然后在投票数≥10的部分上训练。获得较好的模型后，进行伪标签预训练。

数据增强：

2D频谱图解决方案采用两阶段训练：

数据准备与预处理
使用Kaggle频谱图+EEG频谱图
每个eeg_id仅生成一个样本，数据从中间位置截取

EEG频谱图生成方法：梅尔频谱图

K折交叉验证： 5折，按患者分组

数据增强：

模型：

训练细节：

这样做的原因是注意到1D模型和2D模型的梯度变化差异很大（最大差异达1e10倍），同时1D和2D模型拟合所需的学习率变化也不同（差异在1e10-1e100量级），因此采用了分别训练的思路。

同时，对1D模型进行了一些改进。我们对EEG波形进行切片，例如10000→2000*5，然后在每个2000长度上分别进行卷积操作，而不是在整个10000长度上卷积，这带来了一定的性能提升。

测试时增强（TTA）
我们对大量模型使用TTA，以尽可能提升每个模型的性能。

排序Kaggle频谱图
Kaggle频谱图四个通道的顺序为['LL','RL','LP','RP']，而EEG的顺序是['LL','LP','RP','RR']，因此在一些模型中我们尝试重新排列Kaggle频谱图，使其与EEG的通道顺序保持一致。

原始帖子 https://www.kaggle.com/competitions/hms-harmful-brain-activity-classification/writeups/27-38th-solution-1d-models-and-1d-2d-models