返回列表

[34th place] My first silver solution :P

391. ALASKA2 Image Steganalysis | alaska2-image-steganalysis

开始: 2020-04-27 结束: 2020-07-20 网络安全 数据算法赛
[第34名] 我的第一个银牌解决方案 :P

[第34名] 我的第一个银牌解决方案 :P

作者:Khoa Ngo | 比赛排名:第34名

首先,非常感谢主办方组织了如此有趣的比赛!同时,也祝贺所有的参赛者,特别是获奖者。

感谢 @shonenkov 提供的精彩内核 这里,我(也许还有许多人)对这个问题有了很好的切入点。我主要使用他的内核作为我解决方案的基线,并做了一些修改。以下是详细内容。

数据增强

  • 水平 + 垂直翻转
  • 旋转90度
  • Cutout(挖空)
  • 裁剪 + 填充

根据我的理解,当应用DCT变化时,误差会分散到所有像素上。我们使用深度学习模型来捕捉像素域中的这些变化。因此,任何不涉及插值的增强(这里的插值是指像调整大小、非90度旋转等图像处理操作)都可以使用(讨论)。

建模

我在这次比赛中尝试了相当多的主干网络:

  • Se-ResNeXt, DenseNet, NASNet 等。它们可能效果也不错,但与 EfficientNet 相比收敛速度非常慢。
  • EfficientNet B3, B4, B5(B6, B7 或 B8 对我来说似乎遥遥无期 :((... )。它们的效果相当不错!

我使用了两种输入:RGB 和 YCrCb。它们的表现不相上下,但结合起来后提升了我的分数。

优化器:RAdam 配合 Lookahead。

推理

  • TTAx8:翻转 + 转置
  • 权重融合:7个模型,包括 B3, B4, B5 以及 RGB, YCrCb 输入:
------------------------------------
EfficientNet-B3 RGB, YCrCb, fold 0
EfficientNet-B3 RGB, whole dataset
EfficientNet-B4 RGB, YCrCb, fold 4 
EfficientNet-B5 RGB, YCrCb, fold 2
------------------------------------

结果

  • 我最好的单模型分数:0.92
  • 我最好的集成模型分数:0.924

如果我想起什么有趣的内容可以分享,我会更新这篇文章。再次感谢大家!

同比赛其他方案