返回列表

42th solution: BPE + LSTM-Transformer-CNN + DistillRoberta + Superfast Unsupervised

593. LLM - Detect AI Generated Text | llm-detect-ai-generated-text

开始: 2023-10-31 结束: 2024-01-22 AI安全与对抗 数据算法赛
第42名解决方案:BPE + LSTM-Transformer-CNN + DistillRoberta + 超快无监督

第42名解决方案:BPE + LSTM-Transformer-CNN + DistillRoberta + 超快无监督

作者:Jie Wu

发布日期:2024-01-23

以下是我的简单解决方案:

  • 模型1:公共榜963分数并加入后处理(公共榜:0.963,私有榜:0.894)
    基于预测概率,将前2%转换为1,后10%转换为0

  • 模型2:LSTM-Transformer-CNN模型(公共榜:0.927,私有榜:0.788)

  • 模型3:DistillRoberta模型(公共榜:0.927,私有榜:0.884)

  • 模型4:无监督基线模型 + 模型3(公共榜:0.956,私有榜:0.914,加入后处理后私有榜可达0.917):
    使用模型3预测的前9%作为AI生成部分,后45%作为学生撰写部分。然后搜索前20个学生撰写和AI生成样本以计算最终概率。

  • 最终结果:0.552模型1 + 0.08模型2 + 0.184模型3 + 0.184模型4(公共榜:0.967,私有榜:0.918)

同比赛其他方案