442. Bristol-Myers Squibb – Molecular Translation | bms-molecular-translation
首先,让我祝贺所有的获胜者,并感谢比赛主办方——这真是一个非常有趣的挑战!能够参与一个同时需要计算机视觉(CV)和自然语言处理(NLP)技能的比赛,并且拥有如此大的数据集和非常小的排名波动,真是太棒了。
有趣(也不那么有趣)的是,我一直确信比赛的截止日期其实是在两天后,即6月5日。我错误地创建了截止日期的日历条目,并且从未检查过它是否正确。令我惊讶的是,昨天查看比赛页面时,我才意识到距离结束只有10个小时了!😅
我的解决方案是七个CNN-LSTM编码器-解码器模型的集成。所有模型均使用PyTorch实现,并在配备Quadro RTX 6000 GPU的本地机器上进行训练。
extra_approved_InChIs创建了300万张额外图像(感谢 @tuckerarrants)image = cv2.morphologyEx(image, cv2.MORPH_OPEN, np.ones((2, 2)))
image = cv2.erode(image, np.ones((2, 2)))
ShiftScaleRotate(0.01, 0.01, 0.10)
所有模型均使用基于EfficientNet的CNN编码器和基于LSTM的RNN解码器。下表来自Neptune.ai,显示了我顶级模型的主要架构和训练参数:
最终解决方案在公共排行榜上达到了1.32,在私人排行榜上达到了1.31(第47名)。希望这个总结对你们中的一些人有用。很乐意在评论中回答任何问题,下场比赛见!😊