1st place solution

第一名解决方案

作者：Guanshuo Xu
发布时间：2020-07-21

方法

我结合了一个在空间域（YCbCr）训练的模型和一个在DCT域训练的模型，并使用它们的瓶颈特征训练了一个二级模型。

空间域模型是使用ImageNet权重初始化的SEResNet18。为了使训练有效，我移除了第一层卷积层中的步长和最大池化层。让模型在更长时间内保持较高的分辨率对于捕捉微弱的隐写信号非常重要。在比较ResNet18和SEResNet18的结果时，带有SE块的通道注意力也带来了显著的改进。

为了在DCT域中进行建模，我将8x8=64个DCT分量转换为输入“通道”，因此原始的3x512x512变成了(64x3=192)x64x64。在进入CNN之前，192个原始DCT值进行了独热编码，遵循了这篇论文（http://www.ws.binghamton.edu/fridrich/Research/OneHot_Revised.pdf）的思想。该CNN具有六个带有残差连接和SE块的3x3卷积层，空间大小保持恒定的64x64，直到最后的GAP层。

在数据增强方面，除了rotate90和翻转外，Cutmix的效果也很好。在训练过程中，每次遇到隐写图像时，我还随机将修改位置的DCT值重新分配为+1和-1。

二级模型是一个常规的全连接网络。

结果

我总共进行了四次65000x4/10000x4（训练/验证）的划分。在每次划分上，我都训练了一组上述模型。最终的提交结果是对概率的简单平均。

除了Split4的空间域模型是使用Mixup和10个类别训练的之外，所有其他模型都是使用Cutmix和12个类别训练的。

验证结果如下所示。对于这次比赛，我们不应该使用公共LB（Leaderboard）来进行模型选择。

	YCC	DCT	Combined (组合)
split3	0.9395	0.8706	0.9439
split4	0.9381	0.8749	0.9434
split6	0.9409	0.8674	0.9452
split7	0.9418	0.8719	0.9453

第一名解决方案

方法

结果

同比赛其他方案