返回列表

13th place solution [team summary]

586. Child Mind Institute - Detect Sleep States | child-mind-institute-detect-sleep-states

开始: 2023-09-05 结束: 2023-12-05 健康管理与公共卫生 数据算法赛
```html 第13名解决方案 [团队总结]

第13名解决方案 [团队总结]

作者:kuto、ktakita、Taro_pan、copasta、e-toppo
发布时间:2023年12月6日
竞赛排名:第13名

首先,我想感谢本次竞赛的组织者、所有参赛者以及我的队友们: @ktakita@stgkrtua@copasta@masatomatsui

在本主题中,我将总结我们团队的解决方案。每个模型的详细实现将由各成员分别撰写。

查看详细方案: 第13名解决方案 [K.T. 部分]

解决方案摘要

  • 多任务学习(睡眠状态二元预测 & 入睡/醒来事件预测)
  • 集成学习(9个模型)
  • 重复数据标记特征
  • 多阶段后处理
解决方案架构图

模型架构

通过对以下9个模型进行简单平均集成,每个模型都调整了持续时间和下采样率。我们的模型基于tubo的公开代码,非常感谢!

成员 模型 CV分数 参数
kuto 2D UNet 0.763 骨干网络: efficientnet-b3
持续时间: 5760
下采样: 2
1D LSTM 0.786 特征提取: 1DCNN+小波变换
解码器: 1DCNN+LSTM
持续时间: 17280
下采样: 4
copasta 2D UNet 0.786 持续时间: 17280
下采样: 6
2D UNet 0.780 骨干网络: EfficientNetV2-S
持续时间: 17280
下采样: 6
CenterNet 0.788 持续时间: 17280
下采样: 6
K.T 1D UNet 0.778 网络: 4编码器+4解码器+SE模块
持续时间: 11440
下采样: 2
1D UNet 0.801 网络: 4编码器+4解码器+SE模块
持续时间: 17280
下采样: 4
toppo 1D UNet 0.774 特征提取: Wavenet
解码器: LSTM
持续时间: 11440
下采样: 4
1D UNet 0.765 特征提取: Wavenet
解码器: LSTM
持续时间: 5760
下采样: 2

以下技术在某些模型中表现有效:

  • 为睡眠状态预测差异添加L1损失
  • 学习率预热(warmup)
  • 负采样(背景采样率大于0.5)

数据集处理

所有模型使用的特征:

  • anglez, enmo
  • 小时(sin/cos转换)
  • 重复标记特征(重要

部分模型使用的特征:

  • anglez, enmo差分值
  • anglez, enmo前导值

重复标记特征

某些非佩戴情况用人工数据填充,这些数据是通过以15分钟为步长复制波形创建的。因此,我们添加了标记特征来判断每一步是否为重复波形。这对所有模型都有效,使CV和LB提高了约+0.005~+0.01。作为特征添加到模型中比通过后处理移除人工数据效果更好。

后处理(pp)

在scipy.signal.find_peak后应用以下后处理,1和2更为重要:

  1. 12步(1分钟)单位后处理
  2. 容差后处理
  3. 移除每个序列开头的醒来事件
  4. 移除非配对事件
  5. 序列末尾分数衰减

后处理详情

  • 12步(1分钟)单位后处理 (CV +0.003)

    12步后处理示意图

    评估指标以1分钟(12步)为单位,使用12的倍数步长作为预测值是浪费的。因此,如果预测步长是12的倍数,则将步长偏移±1。

  • 容差后处理 (CV +0.005)

    容差后处理示意图

    将预测事件从容差12-36范围内调整到容差12范围内。将分数衰减的预测放置在距离高置信度预测(分数>0.2)±23步的位置。

```
同比赛其他方案