返回列表

Simple, steady, silver (20th)

421. Rock, Paper, Scissors | rock-paper-scissors

开始: 2020-11-02 结束: 2021-02-22 游戏AI AI大模型赛
简单、稳健、银牌(第20名)

简单、稳健、银牌(第20名)

作者:Kar Ham | 比赛排名:第20名

和其他人一样,我使用了一组已知机器人的集成。

我个人的贡献是我昵称为“迭代伊奥卡恩”的算法,简称 iterioc。

最初的伊奥卡恩算法是采用一个策略,生成3个旋转,然后站在对手的角度进行博弈,并生成对手动作的3个旋转。

我的想法是,如果我们对伊奥卡恩本身再进行伊奥卡恩处理会怎样?设 I(S) 为伊奥卡恩函数,它对预测器 S 执行我上述描述的操作。我们可以通过将 I(S) 输入到伊奥卡恩元预测器中来创建 I^2(S)。甚至可以是 I^3(S),以此类推。经过一些优化,我能够将 I^n(S) 线性化,并将其复杂度降至 O(n)!但这并不是必须的,因为我最多只用到 I^5(S),超过这个范围事情就会变得嘈杂,数值在太多层元处理后不再有意义。(提交的一份 I^500(rfind) 惨败)。

Iterioc 在对抗元策略时表现出了强大的威力,当我们创建 iterioc 的集成时,它更是一个强力引擎。

我有11个银牌代理,它们都使用了“iterioc 集成”的变体。

我最好的解决方案是由 I^3 预测器组成的集成,这些预测器基于 rfind、testing、lucker、其他3个 RPS 比赛算法、决策树、决策森林、kumoko 和 memory_patterns v7.0 创建。评分是通过机器人的加权平均进行的,权重反映了它们的历史表现。每隔一步就会随机出招以干扰对手,但在其他步中我不从概率密度函数中采样。没有时间缩放。

我也许应该深入研究更复杂的集成方法;除了我的标志性 iterioc 贡献外,我的解决方案相当普通。

我留给你们三个没有证明的陈述(我证明了它们,但相当繁琐):

1) 确定性代理的数量是有限的。

2) 设 A 为一个确定性代理,X 为它击败的代理数量,Y 为它输给的代理数量,Z 为它打平的代理数量。所有确定性代理共享通用的 X、Y 和 Z,它们是实际的数字。作为推论,X=Y。

2 意味着存在一些代理输给“石头”但击败 rfind(因为 rfind 击败石头,而它们必须击败相同数量的代理)。所有确定性代理在理论强度上根本是平等的,那些获得更高评分的代理只是击败了群体中更大一部分现有的机器人。

重头戏:3) 针对任何固定已知机器人群体(包括非确定性机器人)胜率最高的机器人是纯确定性的。

参与其中、认识大家并在构建和讨论中与你们合作非常有趣 :)

同比赛其他方案