我的最终解决方案/集成模型由 4 个模型组成。其中 3 个基于公开 Notebook(可能进行了轻微修改):
- 基于 KaplanMeier 目标的 AutoGluon
- 事件掩码 PRL-NN
- 具有单调性的 XGBoost
第 4 个模型是 CatBoost,使用 MultiRMSE 损失和 metric 函数,在 3 个目标上进行训练。此外,对 efs==1 使用 1.2 的 sample_weight,对 efs==0 使用 0.5 的 sample_weight,有助于提高模型性能。
最终集成的权重是通过 scipy.minimize 函数找到的,该函数具有最佳的 CV(交叉验证)和最佳的私有 LB(排行榜)。
因此,该解决方案相对简单,但足以获得一个不错的位置。当然,如果在建模和集成上投入更多精力,可能会获得更好的名次,甚至进入金牌区。