33rd Place Solution

631. UM - Game-Playing Strength of MCTS Variants | um-game-playing-strength-of-mcts-variants

开始: 2024-09-05 结束: 2024-12-02 游戏AI 数据算法赛

第 33 名解决方案

第 33 名解决方案

作者: Neko (ootake)
发布时间: 2024-12-04

我要感谢 UM 组织者和 Kaggle 团队举办如此有趣的比赛。凭借一点运气，我取得了史上最好的名次，我感到非常激动！

概述

结果本质上是两个 CatBoost 模型的集成。
两个模型的主要区别在于特征和超参数。

特征工程

从 LudRules 提取的特征
算术运算：在高特征重要性的特征之间进行
移除特征：移除特征重要性得分为 0 的特征
使用的特征和移除的特征是基于公共 leaderboard 分数确定的。我相信这个决定对结果贡献显著。
模型 1 和模型 2 使用了 mostly 相似的特征，但对于模型 2，排除了 TF-IDF 特征和通过独热编码生成的特征。

验证

对于模型 1 和模型 2，都使用了以 'GameRulesetName' 为组的 GroupKFold。
折数：
- 模型 1: N=5
- 模型 2: N=10

模型训练

模型 1: 支持 GPU 的 CatBoost
- 使用 'RMSE' 作为 eval_metric
- 应用 'R2' 作为 custom_metric
模型 2: 支持 GPU 的 CatBoost
- 应用多个 custom_metric 值：['MAE', 'Tweedie:variance_power=1.5', 'Huber:delta=1.0', 'R2']

由于我缺乏经验和知识，这些指标的选择是基于它们对公共 leaderboard 的影响。我也相信结果与交叉验证 (CV) 相对吻合。

集成与后处理

集成计算方式为：
Model 1 * 0.3825 + Model 2 * 0.7225
基于公开代码，限制高于 1.1 的值是有效的，所以我应用了它。

谢谢。

同比赛其他方案

1st Place Solution

2nd place solution

3rd place solution - two stage flip augmentation stacking with code

4th Place Solution - Wow! - Code Sharing

5th Place Solution