16th Place “Simple” Solution

388. TReNDS Neuroimaging | trends-assessment-prediction

开始: 2020-04-23 结束: 2020-06-29 医学影像分析数据算法赛

第16名 “简单” 解决方案

第16名 “简单” 解决方案

作者： Kanna Hashimoto, hatry
比赛排名： 第16名

首先，我们（@Kanna Hashimoto，@hatry）感谢主办方组织了这场主题非常有趣的竞赛。

方案概览

针对 site1/site2 的对抗验证
- 我们的策略是只使用那些不影响站点分类的特征进行建模。（结果可能并没有意义。）
- 我们进行了对抗验证，仅使用 loading 特征来区分 site1（所有训练数据）或 site2（测试数据，已知属于 site2）。结果显示 AUC 为 0.9。
- 排除了对 site1 和 site2 分类贡献最大的前 3 个特征后，AUC 下降了 0.6 ~ 0.7。
堆叠
- 第一层模型的本地交叉验证分数在 0.163 ~ 0.1575 之间。
- 第二层模型的本地 CV 分数为 0.15674，LB 分数为 0.15766，Private 分数为 0.15786。
我们没有使用 3D CNN 模型。

特征工程

loading, fnc 特征
- 我们创建了乘法和减法变量。
图像间的相关性
- 我们计算了每个用户 ID 对应的 53 张 fMRI 3D 图像的相关系数。去除 0 像素略微提升了本地 CV 分数。
直方图特征，统计特征
- 图像直方图和统计特征也非常有用。仅在整个图像上计算直方图和统计数据就能提高本地 CV 分数，但在被分割成更小立方体的图像上计算特征效果更好。

模型

第一层模型
- Ridge + Optuna + 随机种子平均
- MLP + 随机种子平均
- LightGBM + 随机种子平均
第二层模型
- Bayesian Ridge + Optuna

同比赛其他方案

1st private (1st public) place + code

2nd place solution

3rd Place Solution (+ github code)

No Conv Net (Private: 4th, Public: 2nd)

5th place solution, 3D fMRI part