返回列表

52nd place Solution 🥈 (Public 105th)

496. U.S. Patent Phrase to Phrase Matching | us-patent-phrase-to-phrase-matching

开始: 2022-03-21 结束: 2022-06-20 自然语言处理 数据算法赛
第52名解决方案 🥈 (Public 105th)

第52名解决方案 🥈 (Public 105th)

作者: mipypf (Team: K.T., Taro_pan, S.Kota, Java_is_a_sparrow, mipypf)
比赛: US Patent Phrase to Phrase Matching

简介

首先,我们的团队 (@K.T., @Taro_pan, @S.Kota, @Java_is_a_sparrow, @mipypf) 对主办方组织如此激动人心的比赛表示最深切的感谢。感谢所有相关的工作人员。

我想借此机会感谢我最好的队友 (@K.T., @Taro_pan, @S.Kota, @Java_is_a_sparrow) !

概览

  • 最终选定的两个提交结果总结如下。
提交编号 CV 集成系数确定方法 Public LB Private LB
148a 0.8518 ridge (14个模型) 0.8502 0.8641
153 0.8520 optuna 权重搜索 (15个模型) 0.8506 0.8638

交叉验证策略

使用的损失函数

  • BCEWithLogitsLoss

    我们尝试了几种不同的损失函数,但最终选择了 BCEWithLogitsLoss,因为它的 CV 预测分布最为合理。

出现极低 CV Fold 的现象

集成模型

  • 提交编号 148a:no6, no19, no37, no41, no52, no76, no86, ex28, ex30, ex37, exp055, exp088, exp147d, exp149
同比赛其他方案