目录 1正则形式的博弈 2正则形式的使用 3通用公式 4实例 正则形式的博弈 在博弈论中,正则形式是描述博弈的一种方式。与延展形式不同,正则形式不用图形来描述博弈,而是用矩阵来陈述博弈。与延展形式的表述方式相比,这种方式在识别出严格优势策略和纳什均衡上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的策略,以及和与其相对应的收益。 在非完美信息的完全静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。 正则形式的使用 占优策略 合作背叛 合作 2, 2 0, 3 背叛 3, 0 1, 1 收益矩阵有助于剔除劣势策略,而且经常被用于说明这个概念。例如,在囚徒困境中(右图),参与者会发现因为其他人的背叛,合作成了严格劣势策略。参与者会比较每列的第一个数字,在这个例子中,3>2且1>0。这表明无论横排参与者怎样选择,竖排参与者选择背叛都比较好些。类似地,参与者会比较每列的第二个数字,同样也是3>2且1>0。这说明无论竖排参与者怎么做,横排参与者选择背叛都比较好些。这就证明了此博弈唯一的纳什均衡是(背叛,背叛)。 正则形式的连续博弈 一个连续博弈 左,左 左,右 右,左 右,右 顶 4, 3 4, 3 -1, -1 -1, -1 底 0, 0 3, 4 0, 0 3, 4 这些矩阵只表述同时(或者更一般地,信息不完美的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,左和右。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是: 1. 如果甲选择顶,选择左;否则,选择左 2. 如果甲选择顶,选择左;否则,选择右 3. 如果甲选择顶,选择右;否则,选择左 4. 如果甲选择定,选择右;否则,选择右 右图是这个博弈的正则形式的表述方式。 通用公式 为了用把博弈表述成正则形式,需要提供下列数据: *表示参与者的有限集P,标记为 *每个参与者k在P里拥有有限个纯策略. 一个纯策略组合是参与者策略的联合,这是一个m元组. 则有: 我们用来表示策略组合的集合 收益函数形如 其预期解释是博弈结束时给予单个参与者的奖品。相应地,为了完整地说明一个博弈,收益函数必须在参与者集 P= {1, 2, ..., m}中对每个参与者详细说明。 定义:一个正则形式的博弈的结构形如 这里 P = {1,2, ...,m}是参与者集合, 是纯策略集合的一个m元组,每个纯策略对应于一个参与者,而 是收益函数的m元组。 没有理由在前面的讨论中,把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧,关于有限博弈的研究非常艰深。 实例 一个正则形式的博弈 乙选择左 乙选择右 甲选择顶 4, 3 -1, -1 甲选择底 0, 0 3, 4 有种博弈是参与者同时(或至少在做出行动前不观察其他参与者的动作)做出行动,并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如,如果甲做出行动“顶”,而乙做出行动“左”,则甲得到收收益4,乙得到收益3。在每个回合,第一个数字代表竖排参与者(此处为甲)的收益,第二个数字代表横排参与者(此处为乙)的收益。 其他表述方式 对称博弈(其收益不是依赖于参与者选择的动作)常常被表述为只有一种收益,即竖排参与者的收益。例如,左右两边的收益矩阵表述的是同一个博弈。 两个参与者都有的 雄鹿 野兔 雄鹿 3, 3 0, 2 野兔 2, 0 2, 2 只有竖排的 雄鹿 野兔 雄鹿 3 0 野兔 2 2
目录 1志愿者困境模型 2收益矩阵 3志愿者困境实例2 4相关条目 5参考资料 志愿者困境模型 志愿者困境的博弈模型是,有N个参与者,每人都面临要么牺牲自己小部分利益,要么选择搭便车。 威廉·庞士东用如下场景来描述该博弈:有一个社区都停电了,社区里所有居民都知道,只要有一个人花钱给电力公司打电话,电力公司就会修复这个问题。但是如果没有志愿者,所有人都面临一直没电的情况。如果有一个人决定做志愿者,其他人都会因为没有做而获益1。 该博弈衍生出很多实验,但所有实验的结果都与标准博弈论预测相违背。 收益矩阵 该博弈的收益矩阵如下: 志愿者困境的收益矩阵 另外至少有一个人合作其他人都不合作 合作00 对抗1-10 志愿者困境实例2 还是让我们从一个生活中的小故事开始讨论这个问题。你和一群互不相识的人乘坐飞机旅行,途经一处荒岛飞机出事故迫降了,一切通讯设备都在迫降中损坏,不过好在你们大家人都安然无恙。所有人聚集在一起讨论如何逃生。很快有人发现,这个小岛离附近的大陆其实不远,游泳可以勉强到达大陆,从而找到人求救。唯一的问题是,这附近的海域鲨鱼很多,安全的游过去需要一定的运气。 为了让问题明确,请不要考虑等待路过的轮船发现之类的好运降临或者你竟然不会游泳这类的借口。你们要做出的选择就是,谁来充当这个志愿者,冒着风险游过去解救大家? 在这场博弈中,每个人都企盼出现的对自己最有利的情况,总是由别人站出来游过大海,自己等着被解救。那个游过大海的人则将要面对巨大的风险,甚至是付出自己的生命。然而如果每个人都这么想,则最终不会有任何人站出来去求救,大家都得完蛋。 相关条目 囚徒困境 参考资料 ↑ William Poundstone: Prisoner's Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb (1992) ↑ 梦の旋律.游戏厂商的形象博弈
概述 芝诺是希腊爱利亚学派的一个代表人物,可以说是第一个提出悖论的人。如:1.二分法:穿过一定距离的全部之前,你必须穿过这个距离的一半,传个这个距离的一半之前,你必须穿过一半的一半,即你必须穿过无限多个中点,因而你不可能在有限的时间里穿过这个确定的距离。2.阿喀流斯和乌龟:假设阿喀流斯和乌龟赛跑,乌龟在阿的前面一段距离开始起跑,所以阿必须先跑到乌龟的起跑点,而这时乌龟又向前进了一段距离,如此,虽然阿的速度快于乌龟,阿越追越近,但总也追不上乌龟。3.飞矢不动.箭在飞的过程中,在每一个瞬间来看都是静止,所以箭是不动的。时空是否可以无限分割芝诺悖论的关键是使用了两种不同的时间测度。原来,我们用来测量时间的任何一种“钟”都是依靠一种周期性的过程作标准的。如太阳每天的东升西落,月亮的圆缺变化,一年四季的推移,钟摆的运动等等。人们正是利用它们循环或重复的次数作为时间的测量标准的。 芝诺悖论中除了普通的钟以外,还有另一种很特别的“钟”,就是用阿基里斯每次到达上次乌龟到达的位置作为一个循环。 用这种重复性过程测得的时间称为“芝诺时”。例如,阿基里斯是希腊传说中跑得最快的人。一天他正在散步,忽然发现在他前面100米远的地方有一只大乌龟正在慢慢地向前爬。 乌龟说:“阿基里斯! 谁说你跑得最快?你连我都追不上!”阿基里斯回答说:“胡说!我的速度比你快何止百倍!就算刚好是你的10倍,我也马上就可以超过你!”乌龟说:“就照你说的,我们来试一试吧!当你跑到我现在这个地方,我已经向前爬了10米。当你再向前跑过10米时,我又爬到前面去了。 每次你追到我刚刚耽过的地方,我都又向前爬了一段距离。你只能离我越来越近,却永远也追不上我!”阿基里斯说:“哎呀!我明明知道能追上你,可你说的好像也有道理,这是怎么回事呢? ”这个有趣的悖论,是公元前5世纪古希腊哲学家芝诺提出来的。在2 000多年的时间里,它使数学家和哲学家伤透了脑筋。先看下面的图┴───────┴────┴───┴──┴──┴──A B C D E F…… 阿基里斯在A点时,乌龟在B点;他追到B,它爬到C;他追到C,它爬到D,……我们看到,阿基里斯离乌龟越来越近,也就是,AB,BC,CD,……这些线段越来越短,每个都只有前一个的1/10,但是每一个线段的长度都不会是0,这就是说,当阿基里斯按上面的过程去追乌龟时,在任何有限次之内他都追不上乌龟。 那么,阿基里斯真的追不上乌龟了吗? 当然不是。所以会产生上述困难,是因为忽视了一个十分重要的因素:由于那些线段越来越短,阿基里斯跑完那些线段所用的时间也越来越短,下一次只相当于上一次的1/10。 芝诺悖论的关键是使用了两种不同的时间测度。原来,我们用来测量时间的任何一种“钟”都是依靠一种周期性的过程作标准的。如太阳每天的东升西落,月亮的圆缺变化,一年四季的推移,钟摆的运动等等。人们正是利用它们循环或重复的次数作为时间的测量标准的。 芝诺悖论中除了普通的钟以外,还有另一种很特别的“钟”,就是用阿基里斯每次到达上次乌龟到达的位置作为一个循环。 用这种重复性过程测得的时间称为“芝诺时”。例如,当阿基里斯在第n次到达乌龟在第n次的起始点时,芝诺时记为n,这样,在芝诺时为有限的时刻,阿基里斯总是落在乌龟后面。但是在我们的钟表上,假如阿基里斯跑完AB(即100米)用了1分钟,那么他跑完BC只要6秒钟,跑完CD只需 0.6秒,实际上,他只需要1 1/9分钟就可以追上乌龟了。 因此,芝诺悖论的产生原因,是在于“芝诺时”不可能度量阿基里斯追上乌龟后的现象。在芝诺时达到无限后,正常计时仍可以进行,只不过芝诺的“钟”已经无法度量它们了。这个悖论实际上是反映时空并不是无限可分的,运动也不是连续的。 这些方法现在可以用微积分(无限)的概念解释。 相关条目 悖论
目录 1纸牌悖论 2纸牌悖论的形式 纸牌悖论 纸牌悖论就是纸牌的一面写着:"纸牌反面的句子是对的。"而另一面却写着:"纸牌反面的句子是错的。"这是由英国数学家Jourdain提出来的。 纸牌悖论的形式 它最简单的形式是: "悖论元" 下面这句话是对的, 上面这句话是错的。 这也是一个有名的悖论,叫乔丹真值(Jourdain Truth-Value)悖论。
概述 子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡。 阐述 子博弈子博弈是原博弈的一部分,它本身可以作为一个独立的博弈进行分析。例如图1中,每一列或每一行都是一个子博弈,任何博弈本身则被称为自身的一个子博弈。在A先采取行动后,B对A的回应构成包括原博弈在内的三个子博弈。 子博弈 房地产开发商A是先行动者。在行动之前,A对竞争者B的战略进行了预测,认为B有四种战略可选:无论A是否开发,B都要开发;如果A开发,B也开发;如果A不开发,B也不开发。如果A开发,B就不开发;如果A不开发,B就开发。无论A是否开发,B必定不开发。 将B可能采取的战略与图1中博弈双方相应选择的得失结合起来,可以得出下图。 子博弈 子博弈在图2中,存在着两个纳什均衡,即(A开发,B不开发)和(A不开发,B开发),而在B可能选择的战略中:战略1虽然包括了上述后一种纳什均衡,但没有包括前一种纳什均衡;战略4虽然包括了上述前一种纳什均衡,但没有包括后一种纳什均衡;战略2则上述两种纳什均衡都没有包括;只有战略3包括了上述两种均衡。 换句话说,如果B选择战略3,那么不论A作出什么选择,B的回应都达到纳什均衡,而在给定B会采取战略3来回应A的选择的前提下,开发是A的最优策略,因而A选择了开发。 以上的分析方法,称为子博弈精炼纳什均衡。只有当某一战略选择在每一个子博弈(包括原博弈)上都构成一个纳什均衡时,这一战略组合才是子博弈精炼纳什均衡。 而前面提到的B的四种战略中,只有战略3在所有子博弈中都构成纳什均衡,所有这一博弈中唯一的子博弈精炼纳什均衡,就是(开发,(不开发,开发)),即作为后行动者的B选择战略3,而作为先行动者的A选择开发。 [1]注:在A选择开发时,无论B选择战略3或战略4,其结果都构成纳什均衡,而子博弈精炼纳什均衡法要剔除的,正是这种在特定情况下是合理的,而在其他情况下不合理的战略组合。
论点 小说《不小心的旅游者》(Le Voyageur Imprudent) 祖父悖论是一种时间旅行的悖论,科幻故事中常见的主题。最先由法国科幻小说作家赫内·巴赫札维勒(René Barjavel)在他1943年的小说《不小心的旅游者》(Le Voyageur Imprudent)中提出。情景如下: 假设你回到过去,在自己父亲出生前把自己的祖父母杀死;因为你祖父母死了,就不会有你的父亲;没有了你的父亲,你就不会出生;你没出生,就没有人会把你祖父母杀死;若是没有人把你的祖父母杀死,你就不会存在并回到过去且把你的祖父母杀死,于是矛盾出现了。 解释 物理 霍金也无法解决“祖父悖论” 平行宇宙 物理学家认为,也许世界是由无数个平行宇宙组成的,而当你回到过去杀你的祖父母时,你杀的其实是另一个宇宙的人(或者你的这个举动也可以创造一个新的平行宇宙),而这个人(你的“祖父”或“祖母”)的死只会使那个平行宇宙的“你”不再存在,而这个平行宇宙的“你”则平安无事。 1、在量子物理中,“多个世界”理论可以如此理解:对于每一个似乎随机的事件来说,只要它的可能性不是零,它所有可能的情形都会在不同的平行世界中发生,造成历史的分支。物理学家大卫·多伊奇认为,当你回到过去去杀你的祖父母时,你其实进入了另一个世界,杀的是另一个世界的人。(那个世界与你的世界的差别仅在于你祖父母死了) 2、M理论,作为至今最有可能结合5种不同的弦论的理论,是如此解释平行宇宙的:多个三维的“膜”可以同时在一个四维的宇宙中存在;这些膜之间的撞击会在膜中产生大量的能量——这也可以解释大爆炸是如何起源的。可是,M理论并不能解释不同膜的历史之间的关系,也不能肯定,当你回到过去时,你会进到另一个膜里面。 霍金 霍金把“祖父悖论”的结论置放在“不能干预物理律”,既不能干预历史的层面上,应该说是不错的。但他不明白一个更为深层的理论,那就是顺向的逻辑顺序的物理衍生并不是理论上的逻辑定义。 因为,那种线性的逻辑思维的顺序,恰恰是一个狭隘的三维空间的思维顺序,是人们在一般状态下的人类的思维顺序,这种思维的基础是建立在三维空间的地球引力之上的线性思维,而不是宇宙思维,不是超出了引力场之后的,摆脱了线性思维的局限性的空间思维。 因为存在这么一个逻辑悖论,有人提出了“年代保护猜想”,即在我们的宇宙中如果允许时间旅行,又存在改变过去的可能性,那么“时间机器”将不会被发明。在霍金2010年的文章中,并没有对此作出突破性的解释。”[1] [2] 相关联系 与“相对论” 现代概念的时光机 一百多年前(1895年),威尔斯发表了著名科幻小说《时间机器》,它被称为利用科学进行时空旅行题材科幻小说的开山鼻祖。当时及在之前都会被别人看作“不切实际的幻想”。而10年后也就是1905年,爱因斯坦的狭义相对论的发表,则从科学上把这些幻想变为了现实。爱因斯坦的狭义相对论首次提出:时间是相对的。并推断:如果人以接近光速旅行,那么时间对他来说就会停滞。 狭义相对论的理论是可以飞越未来,但是不能回到过去。因为当在物体接近或超过光速的时候,时间有可能只很慢或者是静止的,不可能使时光倒流。又过了10年也就是1915年,爱因斯坦提出广义相对论,第一次将时间与空间合并在一起了。广义相对论提出了时空隧道的概念。时空隧道是在一个在引力场下能变化的一个东西,当空间折叠之后,空间折叠的两点中间打开一个洞相通的话,就可能走一个空间的捷径——虫洞。 但随即而来的的疑问则很多,比如如果我们回到过去,自己杀死了自己的母亲或外婆,那我从何而来?这种混乱的逻辑在科学界这被称为“祖父悖论”。但爱因斯坦并未给出回答,包括鼓吹时间旅行可行的时间大师霍金也未能找出令人信服的解释。 与蝴蝶效应 如果用蝴蝶效应来反驳父悖论能得出不同的答案。 蝴蝶效应(Butterfly Effect)是指在一个动力系统中,初始条件下微小的变化能带动整个系统的长期的巨大的连锁反应。这是一种混沌现象。 蝴蝶效应通常用于天气,股票市场等在一定时段难于预测的比较复杂的系统中。此效应说明,事物发展的结果,对初始条件具有极为敏感的依赖性,初始条件的极小偏差,将会引起结果的极大差异。 蝴蝶效应在社会学界用来说明:一个坏的微小的机制,如果不加以及时地引导、调节,会给社会带来非常大的危害,戏称为“龙卷风”或“风暴”;一个好的微小的机制,只要正确指引,经过一段时间的努力,将会产生轰动效应,或称为“革命”。 蝴蝶效应在混沌学中也常出现。又被称作非线性。所以说不可能存在父悖论。[3]
脏脸博弈概述 三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步……循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。 脏脸博弈分析 这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。在台面上的博弈之前,私下的算计已经置对手于死地。不过,很可能对方也预料到这一点,早也想到这一点,同时杀来。终于,形成双死局面。 当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知,双方只要各自依之行事就可以了
博弈论中,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。