[34th place] My first silver solution :P

391. ALASKA2 Image Steganalysis | alaska2-image-steganalysis

开始: 2020-04-27 结束: 2020-07-20 网络安全数据算法赛

[第34名] 我的第一个银牌解决方案 :P

[第34名] 我的第一个银牌解决方案 :P

作者：Khoa Ngo | 比赛排名：第34名

首先，非常感谢主办方组织了如此有趣的比赛！同时，也祝贺所有的参赛者，特别是获奖者。

感谢 @shonenkov 提供的精彩内核这里，我（也许还有许多人）对这个问题有了很好的切入点。我主要使用他的内核作为我解决方案的基线，并做了一些修改。以下是详细内容。

数据增强

水平 + 垂直翻转
旋转90度
Cutout（挖空）
裁剪 + 填充

根据我的理解，当应用DCT变化时，误差会分散到所有像素上。我们使用深度学习模型来捕捉像素域中的这些变化。因此，任何不涉及插值的增强（这里的插值是指像调整大小、非90度旋转等图像处理操作）都可以使用（讨论）。

建模

我在这次比赛中尝试了相当多的主干网络：

Se-ResNeXt, DenseNet, NASNet 等。它们可能效果也不错，但与 EfficientNet 相比收敛速度非常慢。
EfficientNet B3, B4, B5（B6, B7 或 B8 对我来说似乎遥遥无期 :((... ）。它们的效果相当不错！

我使用了两种输入：RGB 和 YCrCb。它们的表现不相上下，但结合起来后提升了我的分数。

优化器：RAdam 配合 Lookahead。

推理

TTAx8：翻转 + 转置
权重融合：7个模型，包括 B3, B4, B5 以及 RGB, YCrCb 输入：

------------------------------------
EfficientNet-B3 RGB, YCrCb, fold 0
EfficientNet-B3 RGB, whole dataset
EfficientNet-B4 RGB, YCrCb, fold 4 
EfficientNet-B5 RGB, YCrCb, fold 2
------------------------------------

结果

我最好的单模型分数：0.92
我最好的集成模型分数：0.924

如果我想起什么有趣的内容可以分享，我会更新这篇文章。再次感谢大家！

同比赛其他方案

1st place solution

[ABBA McCandless] - 2nd place solution overview

3rd place solution

[4th place] Definitely it's overfitting to the public LB. (0.948->0.930)

[8th Place] Brief solution.