Logo cn.artbmxmagazine.com

博弈论

目录:

Anonim

博弈论的发展是一个简单的事实,即一个人与另一个或另一个人有关系。如今,每天轻松面对这一理论是很容易的,例如,当我们在大学报读新学期时,董事会决定要收取的费用时,董事会正在做出决定。我和您的客户一起玩,在这种情况下是学生。对人类而言,博弈论的重要性显而易见,因为他每天都面临着多种游戏情况。

当前,博弈论主要处理当人们以理性的方式相互联系时,即当人们使用推理进行互动时发生的事情。

博弈论

游戏理论导论

心理学家强调儿童游戏的重要性,这种游戏是塑造人格和进行实验性学习以与社会建立联系,解决问题和冲突局势的一种手段。所有针对儿童和成人的游戏,棋盘游戏或体育游戏都是冲突和合作情况的模型,在这些模型中,我们可以识别现实世界中经常重复出现的情况和模式。

对游戏的研究一直激励着科学家们发展数学理论和模型。统计学是数学的一个分支,精确地起源于从计算到机会游戏中的获胜策略。诸如概率,加权均值和分布或标准偏差之类的概念是数理统计所创造的术语,适用于对机会博弈的分析或在必须做出决策和承担风险的频繁社会和经济情况下随机成分。

但是博弈论与统计学有着非常遥远的关系。它的目的不是分析机会或随机因素,而是分析玩家的战略行为。在现实世界中,无论是在经济,政治还是社会关系中,情况都非常频繁,在这种情况下,例如在游戏中,其结果取决于不同代理人或参与者的决定的结合。可以说,这种行为在采用时考虑到对自己和他人“自己和他人的决定的结果”的共同影响是具有战略意义的。

分析这些情况的技术是由数学家约翰·冯·诺伊曼(John von Neumann)开发的。在1940年代初期,他与经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合作研究了这一理论的经济应用。他们在1944年出版的《游戏与经济行为理论》一书开辟了一个出乎意料的广阔研究领域,目前有成千上万来自世界各地的专家在此工作。

博弈论在数学上已经达到很高的水平,并且在解决问题上显示出极大的多功能性。经济学的许多领域(一般均衡,成本分配等)都受益于这种分析方法的贡献。自首次提出以来的半个世纪中,致力于其发展的科学家人数一直没有停止增长。他们不仅是经济学家和数学家,而且是社会学家,政治学家,生物学家或心理学家。还有法律上的应用:职责分配,通过诉讼或调解决定等。

有两种游戏会带来非常不同的问题,并且需要不同的分析形式:

  1. 如果玩家可以相互交流并协商结果,那么他们将是具有效用转移的游戏(也称为合作游戏),其中的问题集中在分析可能的联盟及其稳定性上。实用程序(也称为非合作游戏)玩家无法达成事先协议;这就是所谓的“性别大战”,“囚徒困境”或“鹰鸽”模式的游戏。

没有效用转移的游戏模型通常是两个人,即只有两个玩家。它们可以是对称的也可以是非对称的,具体取决于从每个玩家的角度来看结果是否相同。当一个玩家的收益增加意味着另一方的收益减少相等时,它们可以为零和,否则为零,即当玩家的收益之和可以增加或等于零时。根据您的决定减少。每个玩家在双策略游戏中只能选择两种策略,也可以选择多种。策略可以是纯策略也可以是混合策略。这些包括为每个纯策略分配给定的概率。就重复游戏而言,这些游戏是由同一玩家连续玩几次,如果决定取决于对手在先前比赛中表现出的行为,则策略也可以是简单的或被动的。

起源

博弈论是冯·诺依曼(Von Neumann)和摩根斯坦(Morgenstern)在1944年出版的经典著作《游戏行为理论》中提出的。经济学家古诺(Cournot)和埃奇沃思(Edgeworth)在19世纪特别具有创新精神。后来提到的其他贡献是数学家Borel和Zermelo做出的。冯·诺依曼本人已经在1928年发表的文章中奠定了基础。但是,直到冯·诺依曼和莫根斯特恩的书出现时,世界才意识到研究人类关系的工具有多么强大。

在第二次世界大战之后的二十年中,经济理论中最有趣的发展之一就是博弈论和经济行为理论,该书由乔恩·冯·诺伊曼(Jhon Von Neumann)和奥斯卡(Oskar)共同授权出版于此书中。摩根斯特恩。当前,共识似乎是博弈论与特定商业问题的研究比与一般经济理论更相关,因为它代表了在利益冲突和利益冲突的情况下分析商业决策的独特方法。

近年来,它对经济理论的影响只能说是爆炸性的。但是,即使只是为了理解为什么使用某些术语,还是有必要了解游戏的简短历史。

冯·诺依曼和摩根斯坦研究了两种不同的博弈论方法。首先是战略或非合作方式。这种方法需要详细指定玩家在游戏中可以做什么和不能做什么,然后每个玩家找到最佳策略。一个玩家的最佳选择取决于其他玩家的计划,而这又取决于他们认为第一个玩家会做什么。冯·诺伊曼(Von Neumann)和摩根斯坦(Morgenstern)在具有两名利益截然相反的玩家的游戏中解决了这个问题。这些游戏被称为严格竞争或零和,因为一个玩家的任何获胜总是被另一玩家的相应损失所平衡。象棋Backgamon和Poker是通常被视为零和游戏的游戏。

冯·诺伊曼(Von Neumann)和摩根斯坦(Morgenstern)的书的第二部分发展了联合或合作的方法,他们试图描述具有许多玩家的游戏中的最佳行为。由于这是一个更加困难的问题,因此与零和两人游戏的结果相比,他的结果准确性要低得多也就不足为奇了。特别是,冯·诺依曼(Von Neumann)和摩根斯坦(Morgenstern)放弃了为个人球员指定最佳策略的任何尝试。相反,他们着手对符合理性行为的联盟建立模型进行分类。谈判本身在该理论中不起作用。实际上,他们赞同这一观点,至少从埃奇沃思时代开始,这种观点就在经济学家中盛行,据此,两个人之间的谈判问题本质上是不确定的。

在1950年代初期,数学家约翰·纳什(John Nash)在一系列非常著名的文章中打破了冯·诺依曼(von Neumann)和摩根斯坦(Morgenstern)对自己施加的两个障碍。在非合作方面,他们似乎认为1832年古诺特(Cournot)提出的平衡思想本身不足以建立理论(因此仅限于零和博弈) 。但是,纳什对均衡思想的一般表述清楚表明,这种限制是不必要的。如今,纳什均衡的概念无非就是当每个参与者的战略选择是对其他参与者的战略选择的最佳反应时。贺拉斯(Horace)和莫里斯(Maurice)受博弈论专家顾问的建议,使用纳什均衡。这可能是博弈论专家可以使用的最重要的工具。纳什还为冯·诺依曼(Von Neumann)和摩根斯坦(Morgenstern)的合作方式做出了贡献。

纳什(Nash)不接受博弈论应考虑两个人之间不确定的谈判问题的想法,而是开始提出论据来确定它们。他关于这个主题的想法通常被误解了,也许是结果,博弈论在巴比亚度过的岁月主要用于发展冯·诺依曼和摩根斯坦的合作方法,最终证明了这种方法毫无用处。

约翰·冯·诺依曼(1903-1957)

约翰·冯·诺依曼(John von Neumann)是匈牙利的数学家,被许多人认为是20世纪最伟大的思想家,只能与爱因斯坦(Albert Einstein)媲美。尽管“街上的人”完全不为人所知,但考虑到他积极参与了“曼哈顿计划”,即创建了第一枚原子弹的科学家小组,并参与指导了该计划,他的科学活动的实际意义可以一窥。第一台计算机的生产和开发,或者作为1950年代美国安全理事会的顾问科学家,在计算机策略的设计中扮演着非常重要的角色(尽管是秘密的并且不是非常知名)。冷战。尼古拉斯·卡尔多(Nicholas Kaldor)对他说:“毫无疑问,他是我遇到过的最聪明的人。”

他出生于匈牙利的布达佩斯,是一位富有的犹太银行家的儿子。他接受了认真的教育。他获得了布达佩斯大学的数学博士学位和苏黎世大学的化学博士学位。1927年,他开始在柏林大学工作。1932年,他移居美国,在普林斯顿高级研究所工作。

他对经济科学的贡献集中在两个领域:

  • 他是博弈论领域的创造者。 1928年,他发表了有关该主题的第一篇文章。 1944年,他与奥斯卡·摩根斯坦(Oskar Morgenstern)合作出版了《博弈论与经济行为理论》。博弈论是一个领域,目前有成千上万的经济学家在工作,每天出版数百页。但除此之外,本书中描述的数学公式也影响了许多其他经济学领域。例如,肯尼思·阿罗(Kenneth Arrow)和杰拉德·德布鲁(Gerard Debreu)利用效用理论的公理化解决了一般均衡问题。1937年,他们发表了《一般经济均衡模型》,其中E.罗伊·温特劳布(E. Roy Weintraub)于1983年说:关于数学经济学的重要文章。他根据莫里斯·艾莱(Maurice Allais),贾林·库普曼斯(Tjalling C. Koopmans)等人进行的“最佳增长”的发展,将利率与经济增长联系起来。

奥斯卡·摩根斯坦(Oskar Morgenstern),1902-1976年

他出生于西里西亚的Gorlitz,曾就读于维也纳,哈佛和纽约的大学。他是奥地利学校的一员,也是一位经验丰富的数学家,他参加了卡尔·门格(卡尔·门格的儿子)组织的著名的“维也纳学术讨论会”,该会议吸引了来自各个领域的科学家,他们的协同作用使人们认识到了许多新想法,甚至是新的科学领域。

第二次世界大战期间,他移居美国,在普林斯顿任教。1944年,他与约翰·冯·诺伊曼(John von Neuman)一起发表了《游戏与经济行为理论》。

应用领域

博弈论目前有许多应用,但是,经济学是博弈论专家提出的思想的主要客户。在运用博弈论的学科中,我们拥有:

在经济中:

博弈论在经济学中得到直接应用也就不足为奇了。这本可悲的科学应该用来处理稀缺资源的分配。如果资源稀缺,那是因为想要资源的人多于拥有资源的人。此概述提供了游戏的所有必需要素。此外,新古典经济学家假设人们将在这场博弈中采取合理的行动。因此,从某种意义上讲,新古典经济学只是博弈论的一个分支。

但是,尽管经济学家可能一直都是博弈论的伪装专家,但他们无法取得进步,因为他们无法获得冯·诺依曼和莫根斯特恩提供的工具。

因此,只能分析特别简单的游戏。这就解释了为什么对垄断和完全竞争有充分的理解,而这两个极端之间存在的所有其他不完全竞争的品种现在才开始受到应有的详细对待。

从博弈论的角度来看,垄断之所以简单,是因为它可以被视为单人游戏。完美竞争之所以简单,是因为参与者的数量实际上是无限的,因此,每个个体代理如果单独行动,都不会对市场总量产生影响。

政治学方面:

博弈论对政治学的影响不如对经济学的影响。也许这是因为人们在想法受到威胁时的行为方式要比金钱受到威胁时的行为方式理性。但是,它已成为澄清许多更多范式问题的基本逻辑的重要工具。

在生物学中:

在生物学中,博弈论已被广泛用于理解和预测某些进化结果,例如约翰·梅纳德·史密斯在约翰·梅纳德·史密斯(John Maynard Smith)的论文“博弈论与格斗进化”中提出的稳定进化策略的概念。就像他的《进化与博弈论》一书一样。

在哲学上:

博弈论专家认为,他们可以正式证明为什么即使是最自私的人也可能会发现与邻居建立长期合作关系通常会符合他们开明的自身利益。

为此,他们研究具有重复性的游戏(同一玩家反复玩的游戏)之间的平衡。迄今为止,在该领域几乎没有发现令大卫·休ume(David Hume)感到惊讶的事物,他在200年前就阐明了基本机制。但是,这些想法现在已经牢固地基于正式模型。为了进一步前进,我们将不得不等待在具有多重均衡的博弈中的均衡选择问题上取得进展。当取得这些进步时,我怀疑没有博弈论的社会哲学将是不可思议的-大卫·休David将被普遍视为其真正的创始人。

游戏通用知识的属性

哲学家霍布斯说,一个人的特点是他的体力,热情,经验和理性。

体力:这决定某人可以做什么或不能做什么。运动员可以计划在四分钟内跑一英里,但是对于大多数人来说,执行该计划是不可能的。博弈论将这些考虑因素纳入了游戏规则。他们确定什么对球员是可行的。更准确地说,玩家只能选择游戏中的所有策略。

热情和经验:这些与玩家的偏好和信念相对应。在大多数情况下,两者都必须是常识,才能进行博弈论分析。

原因:在一个人的决策问题中,经济学家简单地假设参与者根据自己的信念最大化其预期收益。在游戏中,事情变得更加复杂,因为平衡的想法假设玩家知道每个人的想法。

规则常识:

正如在博弈论的许多结果中一样,并不能立即证明这一结论取决于“ n”的值必须是常识。但是,如果值“ n”不是常识,则存在纳什均衡。

均衡的概念是博弈论的基础。但是为什么我们期望参与者会使用平衡策略。

有两种类型的响应,第一类是教育型,它们假定参与者经过谨慎推理而具有均衡性。

但是,教育性答案不是唯一可能的答案。也有进化的反应。据此,达到平衡,不是因为玩家事先考虑了一切,而是近视玩家通过在比赛中得分并长时间重复自己来调整自己的行为的结果。

在有限的两人游戏中,没有哪位玩家可以确切地知道什么是纯粹的策略,即使对手混淆了,最终的结果还是会打出某种纯粹的策略,而对手最终会使用这种策略。因此,理性参与者将主观概率分配给每个可能的选择。然后,玩家选择一种策略,以针对这些主观概率最大化其预期收益。因此,如果为对方选择了最佳反应的混合策略,他或她的行为就好像他正在选择对对方混合策略之一的最佳反应一样。

博弈论认为,玩家对对手会做什么的信念取决于玩家对对手的了解。但是,要弄清楚玩家对对手的了解到底是什么还很不清楚。合理性的想法是建立在这样的假设之上的,即至少应该众所周知两个参与者都是理性的。

游戏理论的目标

博弈论的主要目的是确定理性行为在“博弈”情况下的作用,在这种情况下,结果取决于相互依存的玩家的行为。

游戏是指两个或多个玩家竞争的任何情况。国际象棋和扑克是很好的例子,但商业中的双头垄断和寡头垄断也是如此。玩家在游戏中达成目标的程度取决于机会,他和对手的身心资源,游戏规则以及每个玩家遵循的行动方式,即他们的行为。策略。策略是在游戏的每种可能的意外情况下,玩家要采取的行动的规范。

游戏中的所有玩家都应该理性,有才智并了解情况。特别地,假设每个玩家不仅对他本人而且对他的对手都知道整套现有策略,并且假定每个玩家都知道策略的所有可能组合的结果。

同样,在各种各样的游戏中,结果都是一个随机变量,必须建立其概率分布才能对游戏进行求解。在这方面,应当指出,相互依存的参与者的决定并非凭空做出的,这些决定所产生的收益取决于所有参与者所采取的行动。这种相互依存意味着,假设付款是由不受概率影响的不变概率过程产生的,该过程不受一个人选择的行动方式的影响。换句话说,玩家采取的行动可以决定其他玩家的行动,或影响他们以特定方式行事的可能性。可能对结果产生影响的潜力是区分冲突中的决策和不确定环境中的决策的潜力。最简单的严格对抗性游戏模型,其中可能的结果由玩家以相反的顺序得分。

在这一类中,最常见的是恒定和游戏,在这种游戏中,玩家的获利之和是相等的,而不管他们之间的分布如何。恒和游戏的一种特殊情况(我们将考虑的唯一情况)称为两人零和游戏。

反应策略

当游戏重复几次时,每个玩家都可以根据在对手面前做出的决定采用自己的策略。被动策略是在具有重复性的游戏中采用的策略,它是根据其他玩家的先前决定定义的。

最著名的例子是OJO POR OJO(TIT FOR TAT)策略。假设有两个玩家无限期地重复着“囚徒困境”形式的有回报的情况:

囚徒困境

付款矩阵

列播放器

合作 背叛
合作 二二 4号,1号
背叛 一四 3,3 *

行播放器

在这种情况下,“以眼还眼”策略可以定义如下:«在第一场比赛中,我将选择“合作”策略。在接下来的动作中,我将选择与对手在上一个动作»中选择的策略相同的策略。换句话说,如果对方合作,我将与他合作。如果对方是叛徒,我将是叛徒。

另一种可能的反应策略是TORITO(也称为“ BULLY”)。这种策略包括与对手相反:«如果另一位玩家忠诚于一招,我将在下一步出卖他;如果另一个玩家出卖了我,下一次我将忠于他。

在囚徒困境环境中,“以眼还眼”策略提供了很好的结果,而“托里托”策略提供了非常低的平均支出。

另一方面,在Hawk-Dove游戏的环境中,情况恰恰相反:TORITO获得了良好的结果,而OJO POR OJO提供了较低的平均支付额。

猎鹰-鸽子

付款矩阵

列播放器

合作 背叛
合作 二二 3rd,1st *
背叛 1,3 * 四四

行播放器

在现实生活中,很容易发现情况和人(包括我们自己),其中显示了用EYE FOR EYE或TORITO策略容易识别的行为。

在第一种情况下,它们是塔利翁法则所描述的行为。在律师,专业谈判代表的办公室里,有一个标语,上面写着:“好,我很好,坏了,我更好。” 归根结底,所有人都在某个时刻做出了承诺,要在困难的情况下维持这一策略,在这种情况下,对手可以选择伤害我们还是尊重我们,并且我们期望有机会“击退他”。

第二种情况也很常见。在拉丁美洲,人们称其为“公牛”,而在西班牙则称其为“公鸡”。就是说,一个人非常有进取心,但是如果他也做出了积极的反应,就会“下车”。

游戏理论中的双寡头

在寡头垄断中,每个公司获得的结果不仅取决于其决策,还取决于其竞争对手的决策。因此,企业家的问题涉及可以用博弈论技术进行分析的战略选择。

假设两家公司Hipermercados Xauen和Almacenes Yuste在百货商店领域形成了本地双头垄断。当传统的1月份到来时,两家公司都倾向于在广告上进行大量投资,以至于它们通常会损失全部利润。今年,他们已经达成协议,并决定不做广告,以便每个人只要遵守协议,就可以在5,000万个赛季中获利。但是,其中一个可以秘密地准备其广告活动并在最后一刻启动,从而吸引了所有消费者。在这种情况下,其利润将为7500万,而竞争公司将亏损2500万。

可能的结果可以安排在付款矩阵中。每个仓库必须在两种策略之间进行选择:尊重协议-合作-或广告-背叛-。每个框左侧显示的利润或损失是Xauen选择左侧显示的策略而Yuste选择上方显示的策略时获得的利润或损失。框中右边的结果是Yuste的结果。

广告竞争

你呢

合作背叛
合作 50,50 -25,75

75,-25 0、0

背叛

舍夫沙万

可以获取的最大值为75 M或85M。这一事实对采用决定没有太大影响,唯一真正重要的是结果排序的方式。如果我们用利益的具体价值代替他们在参与者偏好中所占的顺序,矩阵将保持如表所示。这种矩阵中描述的情况在现实生活中非常普遍,被称为“囚徒困境”。

囚徒困境

你呢

合作 背叛
合作背叛 二二 4号,1号
一四 3,3 *

舍夫沙万

让我们看看这些商店应该做出的决定。 Xauen战略部总监会认为:“如果Yuste不做广告,对我们来说最好的是背叛该协议,但是如果他们是第一个背叛该协议,那么对我们来说也很方便。无论我们的竞争对手采取什么策略,背叛他们都是我们的最大利益。 Yuste战略部门的主管将做出类似的推理。

结果,双方将相互背叛,并且比保留协议的结果更糟。收益矩阵中标有星号的方框是唯一稳定的解决方案:它是纳什均衡点。与亚当·斯密的论证相反,在以囚徒困境为特征的情况下,如果代理人理性地寻求自己的利益,“看不见的手”将导致他们取得社会上不希望的结果。

现在假设情况略有不同。如果两家公司陷入价格战之中,并且越来越大,那么两家公司都将遭受重大损失,每家损失2500万。他们已经达成协议,不与每个人的五千万收入挂钩。如果其中一个违反协议,仅对其进行少量削减,它将获得7500万美元的利润,而另一个将失去许多客户,而不会损失任何利润或损失。

价格竞争

你呢

合作背叛
合作背叛 50,50 0,75
75,0 -25,-25

舍夫沙万

如果像在前面的案例中那样,我们在偏好量表中将具体值替换为它们的顺序,我们将获得在博弈论中称为HenHawk-Dove的矩阵。

猎鹰-鸽子:

你呢

合作 背叛
合作背叛 二二 3rd,1st *
1,3 * 四四

舍夫沙万

现在,战略家的推理将有所不同:“如果我们的竞争对手合作,我们最感兴趣的就是背叛他们,但是如果他们背叛我们,最好是我们合作而不是进行价格战。无论他们做什么,我们都会有兴趣做相反的事情。

在游戏“ Hen”中,玩家的行动顺序非常重要。第一个介入的人将决定与Betray进行竞争,迫使另一个人进行合作,从而获得最佳结果。平衡解决方案可以是收益矩阵中标有星号的两个中的任意一个,具体取决于第一个决定哪个参与者。这两个解都是纳什均衡点。

在几乎所有模型中,无论矩阵的形状如何,游戏的协议或规则都会极大地影响解决方案。除了玩家干预的顺序外,还必须考虑到游戏只玩一次还是重复玩了几次,他们每时每刻所拥有的信息,所涉及的玩家数量以及发生这种情况的可能性。组建联盟等

游戏类

囚徒困境

两名罪犯被逮捕并关押在隔离牢房中,以使他们无法相互交流。执达官怀疑他们参与了银行抢劫案,可判处十年监禁,但他没有证据。他只有证据,可以将其归咎于轻罪,非法持有武器,并处以两年徒刑。您向每个人保证,如果您提供证据证明他们将抢劫银行行为归咎于对方,他们将把他们的刑期减半。

每个囚犯的替代方案可以以回报矩阵的形式表示。“忠诚”策略是保持沉默,不要提供任何证据来指控您的伴侣。我们将替代策略称为“叛国”。

囚徒困境

付款矩阵

(入狱多年)

囚犯和

忠诚背叛
忠诚 2/ 2月10日/ 1
叛国罪 5月1 日至10月5日

囚犯X

条形左侧或右侧的付款表示分别根据囚犯X或Y选择的策略分别判刑的监狱年限。

我们可以简单地指出每个囚犯对相应结果的偏爱顺序,而不是用监禁年数来表示付款,因此该模型变得更加普遍。

囚徒困境支付矩阵

(首选项顺序)

囚犯和

忠诚背叛
忠诚 2/ 2

1/ 4

4/ 3月1/3 *
叛国罪

囚犯X

maximin策略在此游戏中的应用导致次优结果。不知道另一名囚犯的决定,最安全的策略就是背叛。如果双方都出卖,则双方的结果都比双方都选择了忠诚度差。该结果是纳什平衡点,并在矩阵上用星号标记。

正如我们所描述的,囚徒困境是一个非零和,两人,双重战略和对称的博弈。它是1950年由AW Tucker首次进行形式化和分析的。它可能是“博弈论”中最著名和研究最多的游戏。在此基础上,开发了多种变体,其中许多是基于游戏的重复性和反应性策略的设计。

Falcon-Paloma模型

用普通的语言,我们通过“鹰派”来理解那些主张采取更具侵略性的策略的政客,而我们将和平主义者视为“鸽子”。Falcon-Paloma模型用于分析侵略性策略与和解策略之间的冲突情况。这种模式在盎格鲁撒克逊人的文学中被称为“鹰鸽”或“鸡”,在西班牙语中也被称为“ gallina”。

在霍利伍德(Hollywoodian)摄影作品中,多次采用这种模式的面对面车辆都面临挑战。这两辆车以相同的直线和高速彼此相对。刹车或弯路的人都输了。但是,如果他们都不放慢脚步或转弯……

该模型还被广泛用于代表两个超级大国之间的冷战。在这种情况下,猎鹰战略包括进行武器和战争升级。如果一个玩家维持猎鹰策略,而另一个选择鸽子策略,则猎鹰获胜而鸽子则输。但是,对于这两家公司来说,最糟糕的情况是当两家公司坚持猎鹰战略时。可以使用以下收益矩阵对结果进行建模。

猎鹰-鸽子

付款矩阵

玩家Y

鹰鸽
鸽子 第二,第二,第三,第一*
1日,3日* 4日,4日

玩家X

注意此模型与囚徒困境之间的细微但重要的区别。原则上,矩阵非常相似,第三次和第四次付款的头寸已经简单交换过,但解决方案和分析现在大不相同了。

纳什均衡在这里有两个结果:每个参与者选择的策略都不相同;在此处表示的矩阵中,这些解决方案均标有星号。相反,要验证在囚徒困境中,纳什均衡处于两个参与者都背叛的时刻。

该游戏与其他游戏的另一个显着差异是,这里获得了玩家选择策略的顺序的重要性。就像现实生活中的许多次一样,第一个玩赢。第一个选择并表现出Falcon策略,因此第二个选择将被迫选择Paloma策略,效果最差。

性别之战

“性别战争”模型是使用博弈论分析日常生活中常见问题的非常简单的例子。有两个参与者:“ HE”和“ SHE”。他们每个人都可以在两种可能的策略之间进行选择,我们将其称为“足球”和“迪斯科”。

假设HE的优先顺序如下:

  1. (首选)HE和SHE选择了足球,HE和SHE选择了夜总会,HE选择了足球,SHE选择了夜总会(最不推荐),他选择了夜总会,SHE选择了足球。

假设SHE的偏好顺序如下:

  1. (最优选)HE和SHE选择夜总会。HE和SHE选择足球。HE选择足球,SHE选择夜总会。(最不推荐)他选择夜总会,SHE选择足球。

收益矩阵如下:

性别之战

迪斯科足球
足球 1日,2日3日,4日

4th,4th 2nd,1st

迪斯科舞厅

付款代表优先顺序。在栏的黑色和左侧,付款给EL。

正如我们所描述的,该游戏是一款无重复且无实用程序转让的游戏。没有重播意味着您只玩一次,因此不可能根据其他玩家在先前游戏中的选择做出决定。没有利润转移意味着没有事先沟通,因此无法就二次付款达成协议,进行谈判或达成协议(“如果您来足球,我将向您支付罚单”)。

出现的问题仅仅是协调之一。这是关于同意选举。在没有事先沟通的情况下,结果可能不是最佳的。如果每个玩家都选择自己的最大策略,则他们将获得的赔付(3 \ 3)并非最佳。该解决方案在矩阵上标有星号,这不是纳什均衡点,因为球员很想改变他们的选择:当SHE到达迪斯科并看到他去踢足球时,她会感到渴望更改策略以获得更高的支出。

我们看到的模型是一个对称博弈,因为参与者或策略可以互换,而结果不会改变。我们可以对游戏进行有趣的修改,使其在与现实世界更加接近时变得不对称。假设按HE的偏好顺序将第二和第三位置颠倒了。他更喜欢独自去踢足球,而不是和HER一起去迪斯科。支付矩阵如下:

性别之战

迪斯科足球
足球 1日,2日第2次,第3次
迪斯科舞厅 4、4、3、1日

如果SHE知道回报矩阵,即HE的偏好,那么协调问题就消失了。很明显,无论SHE的选择如何,HE都会始终选择足球策略。知道了这一点,SHE也会始终选择足球策略,因为她更喜欢和HIM在一起,即使在HIM中也比在Disco中一个人呆。两位选手的最大策略都匹配。标有星号的结果是最佳的鞍点,稳定的溶液和纳什平衡点。请注意,这种解决方案会导致玩家处于社会支配地位的稳定局面,我们有资格成为最自负的人。

最大策略

考虑一个“零和游戏”,其中我赢了的钱被另一名玩家输掉了。每个玩家都有三种可能的策略,我们将分别指定为A,B和C(假设有三张印有这些字母的卡)。

奖品或付款包括十个硬币的分配,这些硬币将根据双方玩家选择的策略分配,并显示在下表中,称为支付矩阵。我的收入(我可以收到的付款)以绿色背景显示。粉色背景上显示给其他玩家的支出。对于任何策略组合,两个玩家的支出总计为十。

付款矩阵 付款给其他玩家的矩阵
另一方的策略 另一方的策略
我的策略
C
9
6
7
之一
5
8
C
我的策略
之一
4
3
9
5
C
8
4
6
3
C
7

例如。如果我玩纸牌C,而另一位玩家选择了他的纸牌B,那么我将获得八枚硬币,另一位玩家将获得两枚。

因此,这是一个零和游戏。零和游戏称为一种游戏,其中一个玩家获胜与另一个玩家失去或停止获胜的游戏完全相同。

为了找出最适合我的策略,我们将分析表示我的付款的矩阵(背景为绿色)。我不知道其他玩家会选择哪种策略(纸牌)。分析游戏做出决定的一种方法是查看每张纸牌可获得的最低结果。在下表中,已添加一栏,表示我的最低成绩。

付款矩阵

另一方的策略
我的策略
9
6
之一
5
C 极小值
之一
4 4
C 7 8 3 3

确实,

  • 如果选择卡片A,我可以得到9、1或2,那么至少我会得到1的结果。如果选择卡片B,我可以得到6、5或4,那么至少我将得到4。如果选择卡片C,我可以得到7、8或3,那么至少我可以得到3。

在所有可能的最小结果中,我更喜欢的是4,因为它是最小最大值

MAXIMIN策略是选择卡B,因为该策略可确保我至少获得4

我们可以预见其他参与者的策略吗?假设其他玩家也希望选择他的MAXIMIN策略。现在,我们仅显示分配给其他玩家的支出,在其中突出显示他可以为每种策略获得的最低支出。我们强调最小值的最大值及其最大值策略。

付款给其他玩家的矩阵

另一方的策略

我的策略
之一
4
9
5
C
8
6
C
极小值
3
之一
7
6

确实,

  • 如果他选择A,他的最差结果将是如果我选择A时我得到9,而他1。如果他选择B,他最差的结果将是如果我选择C中我得到8的结果而他得到2。如果他选择C,他的最差结果是如果我选择B等于4,而他等于6。

因此,您的MAXIMIN策略是打牌C,确保您至少获得6

这是一个具有稳定解决方案的游戏。双方都不愿意改变策略。假设您开始一遍又一遍地重复游戏。我将始终发挥我的最大化策略(B),另一个将始终发挥其最大化策略(C)。每个人都知道对方下次玩什么。任何人都不会试图改变他们的策略,因为任何决定改变他们的策略的人都会失败。

两个玩家的最大化策略一致的结果称为“鞍点”。

并非所有游戏都具有一个稳定的解决方案。只需更改BB和BC框的顺序,先前游戏的稳定性就会消失:

付款矩阵 付款给其他玩家的矩阵
另一方的策略 另一方的策略
我的策略
C
9
6
7
之一
4
8
C
我的策略
之一
4
3
9
6
C
8
5
5
3
C
7

在这个新表中,我的maximin策略仍然是B,其他玩家的maximin策略仍然是C。但是解决方案不再稳定。如果我们重复玩游戏,并且我重复我的最大化策略B,那么另一个人会很想改变他的策略,从C转到B,这样他将获得更高的支付,而不是5。

当然,如果对方开始系统地选择策略B,我将更喜欢将策略更改为C以得到8。然后他将要返回到策略C,依此类推。

马克西姆定理指出,在任何两个人的零和游戏中,除了纯游戏之外,还可能玩混合策略,每个玩家的马克西姆策略在稳定的解决方案中始终是一致的,即鞍点。此定理由John von Neumann在1928年发表的一篇文章中进行了数学证明。

利润转移博彩(合作博彩)

如果玩家可以在付款之前彼此沟通并协商协议,那么出现的问题将完全不同。现在需要分析参与者组成联盟的可能性,这个联盟是稳定的,以及应该如何在联盟成员之间分配收益,以使他们中的任何一个都没有兴趣破坏联盟。

游戏1-从最简单的例子开始。假设安娜,贝尼托和卡门这三个球员必须在彼此之间分配100欧元。分配制度必须以简单多数以民主方式由一个人一票通过。有四个可能的获胜联盟:ABC,AB,BC和AC,但是有无数种方式可以在三个玩家之间分配奖金。

假设Ana提出的分布形式为A = 34,B = 33和C = 33。

贝尼托可以提出一种形式为A = 0,B = 50和C = 50的替代分布。卡门对贝尼托的提议比对安娜更感兴趣,但他可以为她提出一个更好的替代方案:A = 34,B = 0且C = 66。

贝尼托可能会提出一个更好的方案来吸引安娜。

游戏可以无限期继续。它没有解决方案。没有稳定的联盟。无论提出什么提议,总会有一个替代提议,它可以改善每个参与者从新的多数中获得的付款。

定义:在具有效用转移的游戏中,一种解决方案被称为联盟建议和分配分配以确保稳定性,也就是说,获胜联盟的参与者都不会对破坏协议感兴趣。

游戏 2。-现在让我们修改示例。让我们考虑一个加权投票,而不是“一个人一票”。安娜拥有六票,贝尼托拥有三票,

卡门到一个。可能的多数如下:ABC,AB,AC,A。

在这种情况下,Ana将以以下方式提出分布:A = 100,B = 0和C = 0。此分配对应于稳定的联盟,其中Ana的六票赞成。这是一个独特的解决方案。安娜不会接受任何收入少于100欧元的分配,没有安娜的参与,就不会赢得任何胜利。

定义: “游戏价值”是指一个玩家在做出理性决定时能够保证从游戏中获得的报酬,而与其他玩家的决定无关。如果没有至少获得游戏价值作为付款,则没有玩家同意加入联盟。

在游戏1中,所有三个玩家的游戏价值均为零。在游戏2中,安娜的游戏价值为100,贝尼托和卡门的游戏价值为零。

第三局 -让我们举一个比较现实的例子,因此有点复杂。假设有五个政党参加选举的自治市:奥斯特罗党(PA),慈善团体(PB),社区党(PC),民主党(PD)和希望党( PE)。在选举中,他们获得了以下议员人数:

PA = 11

PB = 8

PC = 5

PD = 2

PE = 1

由于没有任何政党取得绝对多数席位,因此有必要组成一个联盟来管理市政当局。该市的年度预算为5.2亿欧元。执政联盟必须将市议会的办公室和职责分配给不同的政党。在谈判中,必须商定各方之间的预算分配,职位和职责。我们假设没有意识形态上的同情或反感,并且职位和责任仅根据其控制的经济预算来评估。为简单起见,我们将假设存在投票纪律,并且不可能背叛内部

博弈分析3.由于议员总数为27,所以获胜联盟必须至少拥有14票。与第二场不同,没有必要的玩家获胜。如果我们使用上面给出的定义,那么对于所有玩家来说,游戏的价值都是零,因为不能保证他们都不属于获胜联盟。

定义:根据劳埃德·S·谢普利(Lloyd S. Shapley)设计的仲裁标准,每个参与者在交易建议中获得的分配被称为“沙普利价值”。准则是按照与玩家以非冗余方式参与的潜在获胜联盟的数量成比例地向每个玩家分配奖金。

如果玩家对于联盟取得胜利不是必不可少的,那么他就是联盟中的多余者。

濒危物种和自然资源。

当前,人们普遍担心大片热带森林的消失以及由于过度开发而导致动物物种灭绝的可能性。这个问题具有与外部影响和公共物品相似的特征,市场也无法以令人满意的方式解决它。与公共物品不同,共有财产的自然资源确实导致或可能引起消费竞争。与外部影响问题不同,外部影响是由私人物品对私人物品造成的技术影响,对公共自然资源过度开发包括由公共财产私有化行为引起的技术和金钱影响

在许多南美国家(例如巴西或哥斯达黎加),热带雨林被烧毁以清理新土地,使定居者得以定居。在远东的热带森林中,特别是在印度尼西亚和菲律宾,其木材财富的开采速度使繁殖速度翻了一番,使需求最多的硬木树种的状况恶化,其中一些已经处于危险之中。消失。过度捕捞严重威胁着几种海洋哺乳动物的生存。许多鱼类学校虽然没有濒临灭绝的危险,但它们的种群减少到破坏秘鲁,不列颠群岛和挪威许多捕鱼种群的地步。

在所有这些情况下,原因都是相似的。丛林,森林,公共牧场,狩猎场或渔业不受私有财产制度的约束。

任何个人或公司都可以访问它们,因此每个人或公司都将尝试获得最佳性能,而不必担心它们将来的保存。经济科学首先研究了关于渔业的问题,渔业已成为传统的例子。

一些激进的生态学家误导了我们,建议我们将动物物种视为“继承的资本”,我们可以从中利用它们的收入,但必须将其“全部”传播给子孙后代。实际上这是不可能的。学校捕捞的任何数量的鱼类不可避免地会减少其人口。这些生态学家用“继承的资本”一词指的是人口的自然平衡点,即如果我们不存在人类,鱼类种群将拥有的规模。保持“整条”数量的鱼的唯一方法是不钓鱼。

取而代之的是,假设我们从一个中间情况开始,即Pa和Pc之间的任何数量的鱼类种群,其增长率都是正的,例如每年3%。如果我们将年捕获量精确地限制在总人口的3%,则银行的规模将无限期保持稳定。因此,可以严格地从生物学角度提出问题:可以无限期实现的最大捕捞量是多少,或者换句话说,增长率最大的种群数量是多少,点Pb在图形中。

生物学家有能力完美地解决这一问题,并且高度熟练地实现了这一目标,从而确定了所捕捞鱼类的最佳年龄以及一年中应进行捕捞活动的时间。渔业的管理或管理被称为允许最佳长期利用的一组研究和技术。

但是,一旦有了最佳解决方案,就需要看我们是否能够应用它。每个人,每个渔船都必须在可以根据囚徒困境建模的环境中选择两个方案。我们将称其为“合作”策略,即尊重合作社或超国家机构同意并根据合理的渔业管理标准制定的配额和法规。我们将称其为“背叛”该策略,该策略包括试图在短期内获得最大的个人利益,即使这意味着超过配额或使用禁止的渔具。

物种与灭绝

其他船

合作背叛
合作 2 2 4 1
背叛 1 4 3 3

我的船

纳什均衡在每个人都背叛的盒子里。因此,趋势是资源被过度开发。

如果有一家公司可以对渔业实行垄断控制,那么有效管理它就不会有困难。这就是为什么第一个解决方案是国家垄断资源并利用其强制力来防止过度开采的原因。这些国家的管辖水域扩展到其大陆架最多200英里,这是1970年代控制捕捞生产的第一步,此后,实行了配额制,设定了最大捕捞量。分配给所有授权捕鱼的公司。

对于生活在距海岸两百多英里或不受任何管辖的海岸上的鲸鱼和其他海洋哺乳动物等物种,解决方案仍然遥遥无期。目前还没有一个全球性国家,其机构有能力管理地球上的所有资源,并具有惩治犯罪者的合法性。

结论

一些理论试图找到合理的策略,这些策略可用于结果不仅取决于一个人自己的策略和环境条件,而且还取决于其他可能具有不同目标的参与者所使用的策略的情况。

博弈论由循环推理组成,在考虑战略问题时无法避免。没有策略的直觉在战略情况下不是很可靠,这就是为什么必须对其进行训练的原因。博弈论目前在我们拥有的学科中有许多应用:经济学,政治学,生物学和哲学。

回应有两种类型,一种是教育性类型,其中参与者认为是经过认真推理的结果才是均衡的;另一种是进化性响应,根据这些行为,它们是达到平衡的,而不是因为参与者他们会事先考虑所有事情,但由于近视玩家会在比赛中得分并长时间重复自己来调整自己的行为。

maximin策略和minimax策略会导致游戏中的两个玩家进入没有任何理由或动机改变其位置的情况。同样,如果某特定策略比他可用的任何其他策略优先,则称该玩家具有主导策略。

参考书目

  • 马丁内斯·科尔MartínezColl),胡安·卡洛斯(Juan Carlos)(2001年):《市场经济中的博弈论》,优点和缺点。http:// //www.eumed.net/gestiopolis.commonografias.comhttp:// //es.wikipedia.org/
下载原始文件

博弈论