421. Rock, Paper, Scissors | rock-paper-scissors
大家好!
这次比赛对我来说是一次非常棒的经历。在过去的几个月里,我学到了很多东西,我希望其他人也能像我一样享受这次比赛。这是我在Kaggle上参加的第三次模拟竞赛,之前我参加过 ConnectX 和 GRF。我非常喜欢这种模拟形式,非常期待下一次模拟竞赛!
在这里,我整理了一份关于我的剪刀石头布游戏方法的通用文章。该方案以1021.0的得分排名第4。我也许应该晚点再发布这个,但我迫不及待地想和大家讨论策略。
我使用了一个由强力智能体组成的大型集成,并生成一个值分布来选择下一个动作。我将这种方法称为“Hydra”(九头蛇),源自希腊和罗马神话中的一种野兽,如果砍掉一个头,原处会长出两个头。这象征着一个“老虎机”,如果一个智能体被利用(击败),另外两个会跳出来继续战斗。
我使用的核心基础是基于 @ilialar 的公开 MAB Notebook 进行了大量改编的模型。
以下是我包含在集成中的智能体。它们由强大的公开机器人以及之前比赛中的旧存档机器人组成。我必须编辑所有这些智能体以适应我的格式,以便它们实现为一个带有 step(obs, config) 方法的类。链接和致谢列在此处: