673. MAP - Charting Student Math Misunderstandings | map-charting-student-math-misunderstandings
感谢组织者和 Kaggle 举办这场有趣且充满挑战的比赛。也感谢所有参与者提供的宝贵 Notebook 和讨论帖。
Qwen3-Embedding-8B、Qwen3 14B 和 Qwen2.5 14B。True_ 和 False_ 前缀,在微调期间使用最终的 37 个标签。correctness = "是" if row["is_correct"] else "否"
input_text = (
f"问题:{row['QuestionText']}\n"
f"答案:{row['MC_Answer']}\n"
f"正确:{correctness}\n"
f"解释:{row['StudentExplanation']}\n"
f"任务:分类解释中的误解。"
)
Qwen3-Embedding-8B 的 sequence classification 方法表现最好。以下是我最终在 Qwen-semble 中使用的模型 summary:
| 模型 | 使用的数据 | 公开榜 (Public LB) |
|---|---|---|
| Qwen3 Embedding 8B | 去重数据 | 0.946 |
| Qwen3 14B | 去重数据 | 0.947 |
| Qwen2.5 14B IT | 去重数据 | 0.947 |
| Qwen3 Embedding 8B | 去重数据 + 增强数据 | 0.945 |
| Qwen3 Embedding 8B | 去重数据 + 伪标签重复项 + 合成数据 | 0.949 (最佳单模型) |
| Qwen3 14B | 去重数据 + 伪标签重复项 + 合成数据 | 0.948 |
| Qwen3 14B | 去重数据 + 伪标签重复项 + 合成数据 (+ 与上面不同的种子) | 0.943 |