568. ICR - Identifying Age-Related Conditions | icr-identify-age-related-conditions
首先,我要感谢Kaggle举办这次比赛,并向所有获奖者致以最诚挚的祝贺!
以下是我解决方案的核心总结。通过研究论坛中关于后处理风险和数据分布的讨论,并进行多次实验后,我深刻认识到:与其复杂化模型,不如重点关注防止小数据集导致的过拟合问题。我将大量时间投入特征工程,同时坚持保持模型结构的简洁性。
我采用了分层交叉验证方法,使用XGBoost模型,并通过RandomizedSearchCV获取最优参数。过程中应用了多种常规特征工程技术。
最终提交在公开排行榜上的得分为:0.18