返回列表

4th Place Solution - Taaha Khan

421. Rock, Paper, Scissors | rock-paper-scissors

开始: 2020-11-02 结束: 2021-02-22 游戏AI AI大模型赛
第4名方案 - Taaha Khan

第4名方案:“HydraRPS:用于算法剪刀石头布游戏的动态加权多臂老虎机动作选择”

作者:Taaha Khan
发布时间:2021年2月5日

大家好!

这次比赛对我来说是一次非常棒的经历。在过去的几个月里,我学到了很多东西,我希望其他人也能像我一样享受这次比赛。这是我在Kaggle上参加的第三次模拟竞赛,之前我参加过 ConnectXGRF。我非常喜欢这种模拟形式,非常期待下一次模拟竞赛!

在这里,我整理了一份关于我的剪刀石头布游戏方法的通用文章。该方案以1021.0的得分排名第4。我也许应该晚点再发布这个,但我迫不及待地想和大家讨论策略。

我使用了一个由强力智能体组成的大型集成,并生成一个值分布来选择下一个动作。我将这种方法称为“Hydra”(九头蛇),源自希腊和罗马神话中的一种野兽,如果砍掉一个头,原处会长出两个头。这象征着一个“老虎机”,如果一个智能体被利用(击败),另外两个会跳出来继续战斗。

我使用的核心基础是基于 @ilialar 的公开 MAB Notebook 进行了大量改编的模型。

集成种群:

以下是我包含在集成中的智能体。它们由强大的公开机器人以及之前比赛中的旧存档机器人组成。我必须编辑所有这些智能体以适应我的格式,以便它们实现为一个带有 step(obs, config) 方法的类。链接和致谢列在此处: