感谢举办这场精彩的比赛!
我非常感谢主办方和各位参赛者。
我赢得了我的第一枚银牌,也是第一次体验了强化学习!
我的解决方案基于 HandyRL 和蒙特卡洛树搜索(MCTS)。
感谢精彩的 Notebook Smart Geese Trained by Reinforcement Learning 和 AlphaGeese Baseline,祝贺这两位作者。
我是强化学习的新手,所以我在黑暗中尝试了各种方法。
通过这次比赛,我学到了强化学习需要更多的训练轮数以及像 MCTS 这样的后处理。
已经公布了一些使用模仿学习的解决方案,所以我想在下一场强化学习比赛中尝试一下!
谢谢大家!