14th place solution: transformer and GRU

第14名解决方案：Transformer和GRU

作者：Inar Timiryasov
发布时间：2023-04-20
得票数：12

我们要感谢此次竞赛的组织者和参与者！我们获益良多，也乐在其中。特别感谢ZhaounBooty早期分享的解决方案，Robin Smits分享的RNN思路的进一步优化，以及Iafoss分享的数据加载器。

以下是我们训练的两种模型的（初步）描述。

我们对整个训练数据集进行了预处理，并将其保存为内存映射文件。我们编写了一个可迭代数据集，实现了非常快速的数据加载。

私有和公开评分均为0.983

训练：

私有和公开评分均为0.987

训练：

在这两种情况下，网络输出都是一个三维单位向量。我们随后直接使用平均角度误差作为损失函数。

有趣的是，尽管计算资源非常有限，GRU模型仍然取得了相当不错的分数。遗憾的是，我们没有时间在GTX 1080上进一步扩展它。

第14名解决方案：Transformer和GRU