646. Playground Series - Season 5, Episode 3 | playground-series-s5e3
我计算了两个 OOF(袋外预测),使用了两个 XGB 模型,一个针对训练数据,另一个针对原始数据。然后结合了预测结果,原始数据的权重为 0.3。
我还通过按每列分组并计算均值、标准差、偏度和降雨比例来添加额外特征。XGB 最显著捕捉到的是降雨比例(组内天数总和除以雨天次数)。
我使用了与上个月 Chirs D. 相同的内层折叠外层折叠结构。这在公共排行榜上没有取得非常好的分数,但出乎意料地在私有 LB 分数上表现很好。
model = XGBRegressor(
objective="reg:logistic",
max_depth=6,
colsample_bytree=0.9,
subsample=0.9,
n_estimators=10000,
learning_rate=0.1,
enable_categorical=False,
early_stopping_rounds=100,
verbosity=2,
eval_metric=['auc'],
)