574. CommonLit - Evaluate Student Summaries | commonlit-evaluate-student-summaries
非常感谢主办方和Kaggle举办这场有趣的比赛。我个人非常享受参与这场比赛的过程。
我的解决方案主要依赖于单个DeBERTa-v3-large模型,并使用了自定义的MeanPooling层。训练时使用了所有文本列:text、prompt_text、prompt_question和prompt_title。训练时最大序列长度为1500,推理时为2048。
为了准备输入数据,我在摘要文本的前后分别添加了两个特殊标记:'[SUMMARY_START]'和'[SUMMARY_END]'。然后,我使用'[SEP]'标记将所有其他提示数据附加到后面。最终的输入文本结构如下:
'[SUMMARY_START]text[SUMMARY_END][SEP]prompt_text[SEP]prompt_question[SEP]prompt_title[SEP]'。
使用上述输入结构,DeBERTa-v3-large模型在最大序列长度为1500的情况下进行训练。我还修改了MeanPooling层,使其仅计算'[SUMMARY_START]'和'[SUMMARY_END]'标记之间的平均值。
需要注意的是,这个单模型的推理时间相当长,大约需要8.5小时。
https://github.com/rohitsingh02/CommonLit-ESS
https://www.kaggle.com/code/rohitsingh9990/commonlit-ensemble-new-v2?scriptVersionId=145818122