559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting
该解决方案是3个月前提交的,如有遗漏,请告知。
比赛的目标是预测美国3315个县(County FIPS)的月度微型企业密度。代码实现结合了多个特殊特性和技术以提高预测精度。
该方法单独预测每个3315个县的微型企业密度。这使得预测能够针对特定区域进行细化,更加准确。
代码使用了流行的技术指标,如指数移动平均线 (EMA)、动量 (MOM)和相对强弱指数 (RSI)。这些指标捕捉潜在趋势、动量和市场状况,增强模型的预测能力。
除了微型企业密度数据外,模型还结合了多个外部数据集。这些数据集包括失业数据、收益、租金、DSG10、税率、房价和人口估计等信息。通过整合这些相关外部因素,模型能够捕捉更广泛的经济和人口因素对微型企业密度的影响。
Optuna用于在Catboost模型中最小化SMAPE。
代码采用了Catboost模型,并使用交叉验证 (CV)来确保模型能很好地泛化到未见数据。
为了预测多个未来时间段,训练了五个独立模型。每个模型针对特定的时间范围进行预测,如t+1个月、t+2个月等。
代码"6-external-datasets.ipynb"可在Kaggle上找到,用于将额外外部数据集整合到预测模型中。
6-external-datasets.ipynb:向预测模型添加额外外部数据集。可在Kaggle上找到,旨在增强特征集。
kaggle_competition_microbusiness.ipynb:包含微型企业密度预测的完整模型训练代码。涵盖数据预处理、使用Catboost和Optuna进行模型训练,以及使用SMAPE进行评估。
如果您觉得此代码实现有价值或有趣,请考虑在GitHub上为其点赞。