返回列表
6nd place solution with code
593. LLM - Detect AI Generated Text
|
llm-detect-ai-generated-text
开始: 2023-10-31
结束: 2024-01-22
AI安全与对抗
数据算法赛
```html
第6名解决方案(含代码)
作者:
Davide Cozzolino
(大师级)
发布日期:2024年1月29日
竞赛排名:第6名
得票数:20票
衷心感谢Kaggle及主办方组织本次竞赛。
解决方案概述
使用预训练的大语言模型(LLM)计算基于熵的合成特征
基于少量特征向量,仅使用主办方提供的人类手写文章作为训练集训练单类SVM模型
注意事项
我使用
DAIGT-V4-TRAIN-DATASET
数据集来筛选最佳特征
测试了多种大语言模型,其中phi-2模型效果最优
相关资源
训练与推理代码
https://www.kaggle.com/code/davidecozzolino/coder-one2
GitHub代码仓库
https://github.com/davin11/entropy-based-text-detector
模型说明文档
https://github.com/davin11/entropy-based-text-detector/blob/main/Documentation.pdf