返回列表

13th place solution

605. Enefit - Predict Energy Behavior of Prosumers | predict-energy-behavior-of-prosumers

开始: 2023-11-02 结束: 2024-04-30 新能源发电 数据算法赛

第十三名方案

首先,我要向组织本次比赛的举办方表示感谢,并向所有获奖者表示祝贺。下面是获得第十三名解决方案的概要。

概述

我使用 LightGBM 分别为生产和消费建立了模型。对于生产模型,我使用的目标值为 (target - target_lag2) / installed_capacity;对于消费模型,我使用的目标值为 (target - target_lag2) / eic_count。在推理期间,我对模型进行了三次重新训练。

验证

我使用单折验证,验证期间为 2023 年 1 月至 2023 年 5 月。提交时,我使用两个随机种子在全部数据上重新训练了生产和消费模型。

目标

生产目标: (target - target_lag2) / installed_capacity
消费目标: (target - target_lag2) / eic_count

主要特征

  • 生产:

    • 日期相关特征(例如假期、月份、工作日)
    • eic_count、装机容量
    • 目标(生产)/装机容量的滞后和差分,包括统计量
    • 目标(生产)/eic_count 的滞后和差分,包括统计量
    • 目标(消费)/装机容量的滞后和差分,包括统计量
    • 目标(消费)/eic_count 的滞后和差分,包括统计量
    • 天气预报
    • 天气预报与历史天气的差异
    • 2 小时前、1 小时前、1 小时后的天气预报以及 1 小时前到 1 小时后的平均值
    • 工作日和周末的滞后目标(生产)/装机容量的平均值(例如,如果预测日是工作日,则取最近两个工作日的平均值;如果是周末,则取最近两个周末的平均值)
    • https://www.kaggle.com/competitions/predict-energy-behavior-of-prosumers/discussion/468654 感谢 @mohammadpakdaman0
  • 消费:

    • 日期相关特征(例如假期、月份、工作日)
    • 目标(生产)/装机容量的滞后和差分,包括统计量
    • 目标(消费)/装机容量的滞后和差分,包括统计量
    • 目标(消费)/eic_count 的滞后和差分,包括统计量
    • 天气预报
    • 历史天气的滞后
    • 工作日和周末的滞后目标(消费)/eic_count 的平均值(例如,如果预测日是工作日,则取最近两个工作日的平均值;如果是周末,则取最近两个周末的平均值)
  • 为了计算效率,只使用 LightGBM 判定的前 300 个最重要的特征用于生产模型,前 400 个最重要的特征用于消费模型。

重新训练

重新训练共进行了三次:2024 年 1 月底、2024 年 2 月底和 2024 年 3 月底。每次都会分别使用两个随机种子对生产和消费模型进行训练。

同比赛其他方案