返回列表

46th place solution - Simple Image Level Multilabel Classifier

434. Human Protein Atlas - Single Cell Classification | hpa-single-cell-image-classification

开始: 2021-01-26 结束: 2021-05-11 生命科学 数据算法赛
第46名方案 - 简单的图像级多标签分类器

第46名方案 - 简单的图像级多标签分类器

作者: Sunghyun Jun
比赛: HPA单细胞图像分类

恭喜所有获奖者!感谢本次比赛的组织者。

特别感谢 @rdizzl3, @phalanx, @alexanderriedel, @thedrcat, @linshokaku, @its7171, @dschettler8845, @samusram 分享知识和数据集。我从你们那里学到了很多。

摘要

“简单的图像级多标签分类器”

标签是通过将分类器应用于由 HPA-Cell-Segmentation 获得的单细胞掩码来确定的。

分类器使用完整数据集进行训练。

工具

  • Colab Pro, GCE, Tesla V100 16GB 单 GPU
  • GCS
  • Pytorch Lightning
  • Neptune
  • Kaggle API

数据集

我同时使用了比赛默认数据集和额外数据集。

额外数据集是参考公开笔记下载的。图像保存为 768px png。大小约为 200 GB。

HPA public data download and HPACellSeg

验证

使用了 MultilabelStratifiedKFold,进行 5 折划分。

多标签分类器的性能通过 Macro-F1 和 Micro-F1 分数进行验证。

iterative-stratification

模型训练

3通道 RGB 图像。图像大小为 1024px,并使用以下数据集进行训练:

  • 1024px 比赛默认数据集 + 768px 稀有类别数据集(调整为 1024)
  • 1024px 比赛默认数据集 + 768px 额外数据集(调整为 1024)
  • AdamW
  • CosineAnnealingLR
  • epochs = 5(完整数据),10(稀有类别数据)。使用了 bce 和 focal loss。
模型 数据集 折数 损失函数 批量大小 初始