首页 > 游戏新闻 > 游戏测评

《信任的进化》简评:简单的游戏却包含对人性的思考

发布时间:2022-03-28 10:03:44 来源:网络 作者:小编秋月

 《信任的进化》是一个看似简单的游戏,但它包含的意义却一点也不简单。作品深入讨论了 ”合作 “和 ”信任 “是如何产生的,为什么 ”背叛 “难以消失,以及游戏的其他理论问题,没有数学公式。首先,玩家要面对一个 ”信任游戏":在每个游戏中,你可以向图片中的机器投入1个硬币,而另一个玩家将得到3个硬币。

 如果两个玩家都投入硬币(合作),他们各获得2个硬币(收到3个,支付1个)。然而,在结果揭晓之前,双方都不知道对方是否会投币,所以你可以选择不投币(作弊),如果对方尽职尽责地投币,他们就会损失1个硬精,而你则净赚3个;如果双方都故意作弊,大家就什么也得不到。如果你仔细想一想,你会发现,无论对方选择 “合作 ”还是 “作弊”,如果你选择 “作弊”,你总是会赚得更多。问题是,这个游戏被设计得非常对称,对手在思考后会得出一个结论,所以我们会 “理性地 ”欺骗对方,但不会像相互合作那样得到更多。

image.png

 如果不是只有一个游戏,而是多个游戏呢?一次欺骗可能会破坏信任,所以合作似乎是一个更好的选择。但如果一直合作,可能会被对方出卖;对方一直合作,也是因为对方是个老好人,欺骗他可以赚更多的钱。于是我们开始思考策略问题,游戏中列出了五个角色,每个角色代表一种策略:先合作,再跟随对方的选择。

 游戏中列出了五个角色,每个角色代表一种策略。“先合作,后跟随对方选择的 ”复读机“;不断作弊的 ”千年老油“;不断合作的 ”万年老粉“;先合作,被对方作弊就会作弊到底的 ”痞子铁“;先尝试 ”合作、作弊、合作、合作 “策略,被对方作弊就会变成 ”复读机“,否则就会变成 ”千年老油"。

image.png

 阿克塞尔罗德的电脑竞赛

 在游戏的说明中,设计者解释了游戏背后的理论基础--主要是研究博弈论中的重复性囚徒困境。事实上,正是 “囚徒困境 ”在一开始就设置了 “信任游戏”。作者还指出,这个游戏是基于阿克塞尔罗德的《合作的演变》。阿克塞尔罗德是密歇根大学的一名政治学家,他在1980年左右举行了一系列计算机竞赛,不同的程序(策略)重复进行囚徒困境,以了解合作是如何出现的。

 尽管当时学术界已经知道囚徒困境的重要性,但阿克塞尔罗德认为,当时的研究方法无助于了解在重复的囚徒困境中如何做出有效的选择,因此他想以计算机竞赛的形式进行研究。在计算机竞赛中,参与者设计一个程序来决定每一步的合作或背叛,该程序可以根据过去的结果做出选择。

 阿克塞尔罗德想把熟悉囚徒困境的人找来,让他们的程序相互竞争,以确保比赛 “能抓住该领域最尖端的知识”。他请来博弈论专家提交程序,在第一次比赛中,14名参赛者来自五个学科:心理学、经济学、政治学、数学和社会学。此外,阿克塞尔罗德还增加了一个随机化程序,随机选择合作或背叛(50/50的概率)。

image.png

 最简单的 “以牙还牙”

 比赛采用循环赛制,每个项目与其他参赛项目进行对决。众所周知,结果是 "Repeater “获胜,但被多伦多大学数学和心理学教授拉波特称为 ”以眼还眼/以牙还牙“。有趣的是,”以眼还眼 “同时也是参赛程序中最简单的一种。阿克塞尔罗德指出,很多人都知道 ”以眼还眼 “的威力,所以很多参与者都使用了它的原理,但这些更复杂的程序都比不上 ”以眼还眼 "本身,它只有四行代码。

 另一个有趣的发现是,有一个特点成为高分和低分的分界线:友善,即永远不做第一个背叛者。在第一次比赛中,前8个程序都是 “友好 ”的,其余的都不是。在友好的节目中,得分最低的节目是最不 “宽容 ”的--一旦被背叛,他们总是会背叛对方。阿克塞尔罗德还提醒说,“友好 ”项目的得分较高,因为它们不断地相互合作以获得高分,这足以提高它们的分数。在这种类型的比赛中,环境非常重要,任何策略的表现都取决于其他策略--在一个其他人都是 “千年老二 ”的世界里,孤独的 “复读机 ”只能得到最低的分数(因为第一次相遇总是被出卖)。

 第二轮的计算机竞赛

 一个程序的表现不能仅由其策略决定,还要由其对手决定,所以阿克塞尔罗德认为,仅看一次比赛的结果是不够的。此外,他认为第一次比赛的结果表明,在如何应对方面还有很多东西需要学习,即使是专家也会犯错误。因此,他举行了第二轮比赛,除了第一轮的参赛者外,他还通过在一个小型计算机用户杂志上发布公告来招募程序。结果,他共收到来自6个国家的62个参赛项目。美国、加拿大、英国、挪威、瑞士和新西兰,从10岁的电脑迷到进化生物学教授都有。所有参加第二轮比赛的选手都首先收到了第一轮比赛结果的详细分析,以便他们能够更成熟地设计自己的策略。

image.png

 第二轮比赛的获胜者仍然是最简单的 “以牙还牙”。“友好 ”规则还是比较有利的--前15名中只有第8名有一个 “不友好 ”的程序 “哈灵顿”,最后15名只有一个 “友好 ”程序。在友好的程序中,那些能够对对手的背叛做出快速反应的程序表现得更好。

 计算机模拟的 “生态 ”竞争

 接下来,阿克塞尔罗德在比赛中加入了生态学的观点,就像《信任的进化》中的 “多重竞争 ”一样,根据每个程序的得分,增加或减少其 “后代 ”的数量,然后再进行比赛。计算机模拟了数千 “代 ”的生态变化,结果是 “以牙还牙 ”一直领先。大约到了第50代,排在最后三分之一的程序基本上已经消失了。从这个时候开始,剩下的程序如何获得高分就变得很重要了:如果高分来自于与其他成功程序的互动,它们可以变得更加成功;但是如果高分来自于利用其他程序,一旦被利用的程序 “灭绝”,分数就会开始下降,面临同样的命运。

 阿克塞尔罗德特别提到了哈灵顿的例子,它是第二轮比赛前15名中唯一 “不友好 ”的程序,它的 “人口比例 ”在200代以前一直在增加,因为它能够利用其他程序。但情况在200代左右发生了逆转,当所有那些 “失败者 ”都灭绝时,它缺乏 “猎物”,在第1000代时就灭绝了。

image.png

 除了 “友好”、“宽容 ”和 “对背叛的快速反应 ”这三个品质外,阿克塞尔罗德认为,“以牙还牙 ”的另一个促成其成功的品质是 “清晰”。因为任何试图利用它的程序接下来都会被背叛,而Tooth for Tooth没有被利用,这一点很容易被识别,所以它的清晰性是一个主要优势。

 在一个自私的世界里,合作仍然是可以发展的

 参与计算机竞赛毕竟是预先编程的,在《信任的进化》中,阿克塞尔罗德试图表明,如果整个团体采用 “以牙还牙 ”的策略,那些采用其他策略的人就很难 “入侵 ”这个团体--即获得更高的分数以获得立足点(但这取决于未来互动的重要性)。当然,如果群体作为一个整体对彼此没有信任,总是背叛,那么没有一个入侵者会成功,但一小群拥有 “好 ”策略的入侵者会成功。相反,如果未来的互动很重要--简单理解为未来相遇的机会足够高--“以眼还眼 ”就不会被入侵。

image.png

 阿克塞尔罗德继续用战时和生态系统的例子来说明,如果条件合适,即使没有友谊,甚至没有先见之明,合作仍然有机会产生。当然,正如 《信任的进化》 所说,在一个可能犯错或造成误解的世界里,“不信任 ”是很难消除的。但阿克塞尔罗德的研究的重要之处在于,它表明即使没有中央管理和参与者以自己的利益为目标,合作仍然可以发展。

 在阿克塞尔罗德的《合作的复杂性》一书中可以找到一个更好的研究,他将遗传算法应用于重复的囚徒困境,让随机产生的策略(仅由最近三次相遇的结果决定)相互竞争和 “交配”,以进化出新的策略。

 研究发现,这种方法可以产生具有 “以牙还牙 ”影子的策略,如 “三次后继续合作”、“被出卖后立即背叛对方”、“被出卖后再次合作”、“三次后继续背叛对方”。

最新发现

相关资讯

今日热榜

热门游戏