返回列表

3rd place solution

362. Google QUEST Q&A Labeling | google-quest-challenge

开始: 2019-11-22 结束: 2020-02-10 自然语言处理 数据算法赛
第三名方案

第三名方案

作者: sakami
发布时间: 2020-02-11

首先,我要感谢组织者和所有团队,并祝贺所有获奖者。
以下是我的方案简要总结:

  • 方案概览
  • 模型架构
  • 训练策略
  • 后处理
  • 融合策略
  • 对我无效的尝试

方案概览

  • 文本列 + 类别列
  • 各种文本截断方式
  • 以下模型的集成:
    • LSTM + Universal Sentence Encoder
    • BERT base uncased * 2
    • BERT base cased
    • BERT large uncased * 2
    • BERT large cased * 2
    • ALBERT base
    • RoBERTa base
    • GPT2 base
    • XLNet base

模型架构

令人惊讶的是,在某些情况下,堆叠 2 个不带激活函数的线性层比单个线性层效果更好。(我是误打误撞发现的。:P)
以下部分模型还额外包含类别嵌入结构。

LSTM 模型

你可以在这里查看我的 LSTM 代码 这里

LSTM模型架构图

BERT 模型

我使用了 2 种模型架构。

BERT模型架构1

BERT模型架构2

ALBERT 模型

ALBERT模型架构

RoBERTa 模型

RoBERTa模型架构

GPT2 模型

同比赛其他方案