47th Place Solution & Code

第47名解决方案与代码

作者: Nikita Kozodoi | 排名: 第47名

首先，让我祝贺所有的获胜者，并感谢比赛主办方——这真是一个非常有趣的挑战！能够参与一个同时需要计算机视觉（CV）和自然语言处理（NLP）技能的比赛，并且拥有如此大的数据集和非常小的排名波动，真是太棒了。

有趣（也不那么有趣）的是，我一直确信比赛的截止日期其实是在两天后，即6月5日。我错误地创建了截止日期的日历条目，并且从未检查过它是否正确。令我惊讶的是，昨天查看比赛页面时，我才意识到距离结束只有10个小时了！😅

我的解决方案是七个CNN-LSTM编码器-解码器模型的集成。所有模型均使用PyTorch实现，并在配备Quadro RTX 6000 GPU的本地机器上进行训练。

使用cv2形态学变换使线条和字母变粗：

image = cv2.morphologyEx(image, cv2.MORPH_OPEN, np.ones((2, 2)))
image = cv2.erode(image, np.ones((2, 2)))

所有模型均使用基于EfficientNet的CNN编码器和基于LSTM的RNN解码器。下表来自Neptune.ai，显示了我顶级模型的主要架构和训练参数：

最终解决方案在公共排行榜上达到了1.32，在私人排行榜上达到了1.31（第47名）。希望这个总结对你们中的一些人有用。很乐意在评论中回答任何问题，下场比赛见！😊

第47名解决方案与代码