目录 1 什么是可信承诺 2 可信承诺的举例说明1 3 可信承诺的的评价 4 参考文献 什么是可信承诺 可信承诺是博弈论中的一个重要的概念,动态博弈的一个中心问题是“可信性”问题。所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为。因为后行为方将来会采取对先行为方有利的行为相当于一种“承诺”,而将来会采取对先行为方不利的行为相当于一种“威胁”,因此我们可将可信性分为“承诺的可信性”和“威胁的可信性”,即可信承诺与可信威胁。 可信威胁是那些对威胁者来说无论是事前还是事中都是有效的。事前有效意味着承诺在把博弈对手看成是和自己同时行动时是有效的,事中有效意味着当采取行动之后该威胁仍然是值得执行的。换言之,可信威胁是符合序贯理性的威胁,它是指当轮到承诺者行动时,他出于自身利益考虑确实会按照原先声明采取行动的承诺1。 可信承诺的举例说明1 一家企业正处于蓬勃发展的阶段,其所在者希望在另一个城市建立一个远程办公室。如果她聘请某人管理这个新建的办公室,她可以向这位管理者支付1000美元的周薪——这比管理者在他处工作得到的收入多出500美元,她自己每周也能获得1000美元的经济利润。这位所有者面临的难题是她无法对管理者的行为进行监督。所有者清楚,管理者如果对远程办公室进行不诚实管理,其每周获得的实际收入可以高达1500美元,但这么做却会使所有者自身遭受每周500美元的经济亏损。如果所有者认为,所有的管理者都是完全利己的收入最大化个体,那么她是否会开设远程办公室呢? 可信承诺 注:最优结果是,在B点所有者开设远程办公室,在C点管理者诚实管理,但是如果管理者的行为是完全利己的,并且所有者知道这一点,那么这条路径就不会是均衡结果。 远程办公室博弈的决策如上图所示。在A点处,管理岗位侯选人许诺诚实管理,然后博弈过程到达B点处,这时所有者必须决定是否开设远程办公室。如果她选择开设远程办公室,那么博弈过程到达C点处,这时轮到管理者决定是否诚实管理。如果管理者的惟一目标是赚尽可能多的钱,那么他会进行不诚实管理(对应C点处下方的分支),这是因为这么做相比诚实管理(对应C点处上方的分支)每周能够给他带来500美元的额外收入。 因此,如果所有者开设了远程办公室,其结果必然是她蒙受每周500美元的经济损失。如果她没有开设远程办公室(对应B点处的下一分支),那么她的经济利润为0,既然0经济利润总要好于500美元的经济损失,那么所有者就会选择不开设远程办公室。最后我们可以计算出,由于管理者不具有可信承诺而对双方造成的机会成本等于1500美元;其中500美元属于管理者失去的额外周薪,1000美元属于所有者无法实现的经济利润。 可信承诺的的评价 对可信承诺理论的研究,深化了人们对于该理论的理解,使其能够从单纯的博弈论中独立出来而成为解释不同经济政治现象的工具。这种工具的应用大大地丰富了经济学原有的理论体系,使经济学对现实世界的解释能力更上一层楼,同时也使得经济学与政治学的边界更为模糊。 然而正如其它的经济理论一样,可信承诺理论本身并不能单独地用来解释纷繁复杂的各类经济问题,因为经济问题的成因是多方面的,可信承诺理论只能与其它的经济理论相结合,才能对经济问题作出全面的解释。国内外对可信承诺理论及其应用的研究大多集中在宪政改革方面,这对我国目前的政治体制改革来说无疑有着很大的启示。 参考文献 ↑ 1.0 1.1 伯南克.《微观经济学原理》M.清华大学出版社,2004
目录 1 什么是可信威胁 2 可信威胁的事例分析1 3 参考文献 什么是可信威胁 所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为。因为后行为方将来会采取对先行为方有利的行为相当于一种“承诺”,而将来会采取对先行为方不利的行为相当于一种“威胁”,因此我们可将可信性分为“承诺的可信性”和“威胁的可信性”,即可信承诺与可信威胁。 用博弈论的语言来描述,可信威胁就是指当轮到威胁者行动时,他出于自身利益考虑确实会按照原先声明采取行动的威胁1。 可信威胁的概念,在华纳兄弟公司的经理们与托尼·班奈特,就托尼·班奈特先生为影片Analyze This演唱片尾曲应获报酬一事的谈判过程中得到了很好的诠释。由于电影的大部分片断都已经拍摄完毕,因此经理们心理清楚,他们不再具有能拒绝托尼·班奈特先生关于报酬要求的可信威胁,因为在那时邀请另一个歌唱家为影片演唱片尾曲的花费将更加巨大。相比之下,在电影开始拍摄之前提出类似的威胁则具有可信性。1 可信威胁的事例分析1 维罗妮卡出差离开所在城镇的时候,一般会随身携带一个昂贵的公文包。某个陌生人对她的公文包产生了兴趣。我们假设,由于维罗妮卡是一位经济学家,她一定是一个利己的理性人。如果对难罗妮卡来说,她的公文包被偷后她报警投诉的成本超过这个公文包的价值,那么这位陌生人能够安全地偷到公文包吗? 只要这个小偷对维罗妮卡的假设是正确的,他就可以在偷到公文包之后逍遥法外。一旦维罗妮卡的公文包被偷,为了进行投诉与指控她必须报警,而且很可能错过返回的航班。数月之后,为了在小偷的审讯出庭指证她,还不得不再次回到案发所在城镇,并且还要接受小偷所聘请律师不怀好意的交互问讯。由于这些成本远远大于公文包的价值,一个理性利己的人显然不会对丢失公文包一事再追究下去。不过,如果维罗妮卡能够表现出在公文包被偷之后她确实具有对小偷的可信威胁,那么她就可以让小偷打消偷窃的念头。但是问题在于,小偷已经清楚失窃后失主找回公文包的成本大于收益,因此这种威胁是不可信的。 参考文献 ↑ 1.0 1.1 1.2 伯南克.《微观经济学原理》M.清华大学出版社,2004
简介零和博弈又称零和游戏(zero-sum game),与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。也可以说:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方都想尽一切办法以实现“损人利己”。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。原理 零和游戏源于博弈论,现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥 零和对策 斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现零和博弈代系统博弈理论的初步形成。 零和游戏是指一项游戏中,游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远为零,零和游戏原理之所以广受关注,主要是因为人们在社会的方方面面都能发现与零和游戏类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。 通过有效合作皆大欢喜的结局是可能出现的。但从零和游戏走向双赢,要求各方面要有真诚合作的精神和勇气,在合作中不要小聪明,不要总想占别人的小便宜,要遵守游戏规则,否则双赢的局面就不可能出现,最终吃亏的还是合作者自己。 游戏规则 零和游戏又被称为游戏理论或零和博弈,源于博弈论(gametheory)。是指一项游戏中,游戏者有输有赢,一方所赢正是另一方所输,而游戏的总成绩永远为零。 零和游戏的内容如下:两人对弈,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分。则若A获胜 零和对策 次数为N,B的失败次数必然也为N。若A失败的次数为M,则B获胜的次数必然为M。这样,A的总分为(N-M),B的总分为(M-N),显然(N-M)+(M-N)=0,这就是零和游戏的数学表达式。 现在广泛用于有赢家必有输家的竞争与对抗。“零和游戏规则”越来越受到重视,因为人类社会中有许多与“零和游戏”像类似的局面。与“零和”对应,现在也常用“双赢”概念。“双赢”的基本理论就是“利己”不“损人”,通过谈判、合作达到皆大欢喜的结果。 零和游戏之所以广受关注,主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面,胜利者的光荣后往往隐藏着失败者的辛酸和苦涩。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的零和游戏场。这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个邪恶进化论式的弱肉强食的世界。我们大肆开发利用煤炭石油资源,留给后人的便越来越少;研究生产了大量的转基因产品,一些新的病毒也跟着冒了出来;我们修筑了葛洲坝水利工程,白鳍豚就再也不能洄游到金沙江产卵了…… 但20世纪以来,人类在经历了两次世界大战、经济的高速增长、科技进步、全球一体化以及日益严重的环境污染之后,“零和游戏”观念正逐渐被“双赢”观念所取代。在竞争的社会中,人们开始认识到“利己”不一定要建立在“损人”的基础上。领导者要善于跳出“零和”的圈子,寻找能够实现“双赢”的机遇和突破口,防止负面影响抵消正面成绩。批评下属如何才能做到使其接受而不抵触,发展经济如何才能做到不损害环境,开展竞争如何使自己胜出而不让对方受到伤害,这些都是每一个为官者应该仔细思考的问题。有效合作,得到的是皆大欢喜的结局。从零和走向正和,要求各方要有真诚合作的精神和勇气,遵守游戏规则,否则“双赢”的局面就不会出现,最终吃亏的还是合作者自己。 [2] 现实意义 对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈:好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。 在这里抽象化后的博弈问题是,已知参与者集合(两方),策略集合(所有棋着) 零和博弈 ,和盈利集合(赢子输子),能否且如何找到一个理论上的“解”或“平衡“,也就是对参与双方来说都最”合理“、最优的具体策略?怎样才是合理?应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。 虽然零和博弈理论的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是有限的。零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。对于后者,历史上最经典的案例就是“囚徒困境”。在“囚徒困境”的问题中,参与者仍是两名(两个盗窃犯),但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。[1] 操作要领 在零和游戏中所有的参与者其获利与亏损正好等于零。赢家的利润来自于输家的亏损。 以下有一些重要的观念是你在了解该交易是否为零和游戏所必须先知道的。这个分类决定于我们对玩家利润与亏损的定义有多宽广。它本身的分类对我们并不重要,但是对发起人就很重要了。要介绍这观念的发展,我们先讨论扑克游戏,然后我们再切入操作,因为扑克相对于操作是一种很好的比喻。 扑克 扑克是一种零和游戏 扑克在朋友之间、在扑克俱乐部、或是锦标赛都可以玩,我们来探讨这些游戏之间的异同。一般来说朋友之间玩扑克是一种典型的零和游戏。无论那一个人赢,就会有其它的人输,这之间的输赢总和是零。 扑克俱乐部里面玩的就不太一样了,因为俱乐部对赌注总额会收取一个固定比率的费用,比方说是1%,则这将形成负和游戏。也就是输赢的总和小于零(如果加上俱乐部的抽成就为零了)玩家们集合亏损给俱乐部。如果我们定义俱乐部也是这个赌局特殊型态玩家的话,这个赌局又变成了零和游戏。换句话说,我们计算赢家所赢的和输家所输的扣除俱乐部抽成的总和,那又变成一个零和游戏了,扣除了付俱乐部的抽成之后,不管是谁赢,其它人就是输家。 锦标赛中的扑克赌局是由赞助商提供奖品,因此它是一个正和游戏(如果它的奖金超过所有参赛者的报名费的话),若我们计算总奖项的净值,那么扑克仍然是一个零和游戏。扣除了奖项之后, 无论是谁赢,其它人都是输。 无论在什么场合玩扑克,这种赌局根本上的特性都存在,它就是一个零和游戏(假设这是一个基准),以这个观点看来,上述三种型态都是相同的,玩家们经常不关心它的基准为何,而持续玩相同的策略。 人们玩扑克要依靠这个基准的理由,撇开技术的差异性,那就是在锦标赛中大部分的玩家是赢家,而俱乐部中大部分的玩家是输家。 扑克是一种正和游戏 到目前为止,我们只凭金钱的贡献来定义扑克赌局中的赢家和输家。若要来解释为什么俱乐部中的玩家平均来说是输,这种定义太过于狭隘。 仔细考虑人们玩扑克的四个理由,前两个理由包含外部的利益,第三个理由包含无益的及不理性的行为,第四点为预期润。 第一可能也是最重要的一点,许多人玩扑克的原因是因为他们单纯地就是想玩(或是学着如何玩)。这些玩家愿意玩,即使一开始就预期会输,这个玩乐的外部利益可以解释为什么朋友之间纵使经常会输给技术较好的人,也会经常性地聚在一起玩。当玩家从扑克中取得此种衍伸乐趣时,扑克就是一种正和游戏。 第二,有些玩家玩扑克是因为他们可能尚未学会如何玩,或是仍无法成为一个技术较好的玩家来经由扑克赚钱。这些新手玩家们可能缺乏信息或是能力有限,但是绝不会不理性。如果他们了解到他们无法经由玩扑克赚钱,他们就会放弃。要学习是否能由扑克当中赚钱的代价相当昂贵,这些知识是藉由玩扑克可以获得的相当有价值的外部利益。新手玩家经常被称为笨蛋,而“笨蛋在每一分钟都会诞生”。然而,直到他们学习到并评价这个教训,这些人并不是笨蛋。 第三,有些玩家无法学习,或是无法接受他们无法藉由玩扑克来赚钱。这些玩家所追求的微小利润从来就没有实现过,他们经常是不理性的,而且可能有点情绪化。这些玩家是真正的笨蛋,因为他们拒绝去学习他们该学的东西,或是坚持花最高昂的代价去学习一些无用的方法。 最后,有些玩家玩扑克是因为他们是真正的行家,这些具有高超技术的玩家总是赢走其它玩家们的钱。他们所赢的可以超过所需的支出,这些支出包含给俱乐部的抽成,以及他们如果做别的工作可以得到的薪水,以及要维持专业与竞争力所产生的费用。这些玩家从那些愿意把钱输给他们的技术较差的玩家手中获利(也许是俱乐部)。这些人通称为“郎中”,因为他们捕食较弱的玩家。较弱的玩家通常避免与郎中同局,为了避免被认出来,这些郎中总是经常变换地方来捕食。如果郎中无法寻得猎物,或由于猎物们成功地避开他们,或由于猎物们一下子就放弃了,这些郎中也很难以生存。 交易 交易是一种零和游戏 像扑克一样,交易的分类可以分为零和游戏、负和游戏、或是正和游戏,完全取决于我们如何定义利润和亏损。 倘若我们只以获利和亏损来当作基准衡量交易,那么它必然是一个零和游戏。举例来说,假设操作利润和亏损被定义为与基本价值相对应(基本上它无法观察),那么当买方和卖方交易,他们会设定一个价格,如果这个价格高于基本价值,卖方就取得买方支出的利益。在市场上若没有其它交易员的亏损,不会有任何一个交易员获利的。既然我们无法确定地观察出基本价值,亦即交易员也无法确知他们的利润及亏损,则他们交易时间中的不确定性就不会改变零和游戏的本质。 如果所用的基准对买方和卖方是相同的,那么用来定义利润和亏损的基准并不影响零和游戏的本质。这个基准决定我们如何来解释利润和亏损。当我们用基本价值作为基准,我们解释价格和基本价值间的不同点为基本操作利润或亏损,不幸地,在没有定义以及估计基本价值之前,这些利润和亏损无法被估计。 就这个观点而言,操作利润和亏损的定义是以应用于买卖双方的一般基准为基础。一般常见的基本价值基准产生了零和游戏。一般报酬基准产生的游戏可以很容易地经由调整来成为零和游戏。不管如何,没有其它交易员的亏损,是不会有任何交易员有所获利的。基于这个论点,交易就是一个零和游戏。 交易是一种正和游戏 理性的交易员不会去玩那种只能得到操作利润的纯零和游戏,如果所有的交易员都一样,所有的预期报酬率都是零,就不会有人从交易中获得利益。如果有些交易员技术较其它人好,这些技术较好的交易员愿意交易,但那些技术差的不愿意,那么就没有人交易了。 要解释为什么理性的交易员要交易,首先我们要先认清有些人交易不是只为了预期报酬。人们交易为了避险、为了将资金移转、为了交换财产、为了赚取绝对的报酬、为了学习他们是否可以藉由操作赚钱、或是得到赌博的乐趣。这些外部利益使得交易成为一种正和游戏。如果这些交易的外部利益够好,即使交易员自认会输,还是会去交易。技术好的交易员就可从这些技术较差,但是基于外部利益而进场交易的交易员手中来获利。 市场价格有效地整合信息,而技术较好的交易员根据他们获得的信息来交易以获取利润。如果操作利润超过获得信息的成本,这种行为具有获利性。如果没有人基于外部利益而进场交易,技术好的交易员就无法藉由交易来获利。他们将会放弃他们的研究,进而放弃交易,则价格的效率性将不复见。价格效率是依据技术好的交易员与那些愿意交易或是不理性的输家所创造的,技术好的交易员使得价格产生效率,而那些输家就对他们研究的努力而付费。 应用 零和游戏与金融市场 零和博弈是博弈过程的最基本模型。理想的零和博弈对于金融市场有重要意义。 在金融市场实际趋势运行中,理想零和博弈的全过程接近于一个半圆。当然,所谓半圆,与观察者制定坐标的数值单位有关,如果大幅压缩时间单位,这个半圆看起来就象抛物线;如果大幅扩展时间单位,路线又象一段扁扁的圆弧。因此,在上面表达最高点的时候,提出“公认的相关系数”概念。在这个相关系数引导下,最高点就是一个明确的数值,也就排除了观察坐标绘制过程的伸缩带来的影响。 理想零和博弈,从金融趋势的演变角度来看,最终将构成核心因子。混沌经济学研究者一直希望在证券市场寻找到主宰世界命运的“混沌因子”,事实上,所有金融市场的“混沌因子”就是这么一个理想零和博弈的半圆。而最终,一个半圆的小泡影,也将幻化出五光十色的大千世界,其寿命成千上万年,或者更长。这个小泡影,带有“真善美”的天然属性。 零和游戏与公司治理 公司治理中的零和游戏并非没有一个均衡点,可以从对手之间的博弈转变为正当管理与不正当管理之间的此消彼长,由此避免双方的对抗。正当管理与不正当管理的零和游戏中,正当管理的成份多一点,不正当管理的成份就少一点,反过来也是一样,两者之间存在着零和关系。管理者的精力是有限的,当他把精力过多的用在不正当管理的歪门斜道上时,就会严重影响到正当管理的艰苦卓绝的努力。因此,通过反对不正当管理来完成公司治理的任务,从而促进正当管理,对于把企业蛋糕做得更大,是不可或缺的。 首先,它可以避免所有者和其他相关利益者一方在零和游戏中处于必输的地位。在零和游戏中,管理者一方在信息不对称中处于优势地位,再加上其实际控制着人流、物流、资金流,因而在内部博弈中总是稳操胜券。作为对手的所有者和其他相关利益者一方,要想改变这种被动局面,通过公司治理加以抗衡总是必要的。其次,为反对不正当管理而付出一定成本是合算的。通过建立健全公司治理机制,反对不正当管理,难免要付出一定的成本,但它肯定是在可以承受的范围之内,与在零和游戏中必输的份额相比,与企业资产可能被掏空相比,付出这种成本还是合算的。再次,付出的必要成本使得企业“蛋糕做得更大”更有希望。反对不正当管理至少可以使管理者在内部“零和游戏”中获利的行为得到遏制,通过这种有效的工作使管理者在内部零和游戏中失去优势之后,就有望促使其将自己的聪明才智用在把“蛋糕做得更大”上,因为那样同样可以使他们个人所得的绝对数额更多。 从博弈论的研究来看,解决零和游戏问题的出路在于参与博弈者从零和走向双赢或者多赢,但是其前提必须摆脱零和游戏的思维定势。在企业管理中也是一样,两权分离的公司制发展轨迹不可逆转,而内部零和游戏又会产生内耗,解决的办法与其寄希望于大家在“零和游戏”中握手言和,不如让经营管理者感到实施不正当管理得不偿失,知难而退,一致对外,把企业利益的蛋糕做得更大。 趣闻轶事 说是有两个经济学家,在马路上散步,便讨论经济问题甲经济学家看见了一堆狗屎,思索着对乙经济学家说。你吃了这堆狗屎吧,我给你100万块钱。乙经济学家犹豫了一会儿,但是还是经受不住诱惑,吃了那堆狗屎,当然,作为条件,甲经济学家给了他100万块钱过了一会儿,乙经济学家也看见了一堆狗屎,就对甲经济学家说:你吃了这堆狗屎吧,我也给你100万块钱。甲经济学家犹豫了一会儿,但是还是经受不住诱惑,吃了那堆狗屎当然,作为条件,乙经济学家把甲给他的100万还了回去。 故事还没有完 走着走着,乙经济学家忽然缓过神来了,对甲说不对阿,我们谁也没有挣到钱,却吃了两对狗屎。。。甲也换过神了,思考了一会儿说:可是,我们创造了200万的GNP阿!
连锁店悖论(chain-store paradox) 目录 1 什么是连锁店悖论 2 连锁店悖论的论证过程 什么是连锁店悖论 莱茵哈德·泽尔腾(Reinhard Selten)利用逆推归纳法,说明了在位者的多市场掠夺威胁不可信。而连锁店悖论是指完全信息条件下的有限次重复博弈无法实现参与人之间的合作行为。连锁店悖论是正是由Selten提出的。 连锁店悖论的论证过程 假定在位者在N个相同的市场上经营连锁店,每个市场有一个潜在进入者,每个进入者序贯决定是否进入相应市场。如果市场n(n期)没有进入发生,那么在位者垄断n市场,其收益为M;如果市场n(n期)进入发生,那么在位者需要决定是否实施掠夺:掠夺收益为P,容纳收益为C。假定M> C> P,因为掠夺是有成本的。 假定进入者决定是否进入时知道博弈进程,而且进入者遭遇掠夺的收益严格小于不进入收益,而不进入收益小于进入被容纳的收益。从直观上看,在位者在博弈早期会采用掠夺战略,劝止潜在进入者进入;只有在接近博弈结束时,在位者才会容纳进入。但是Sehen认为,这和精炼解不一致,博弈论逻辑证明的结果与直觉相悖,由此构成了连锁店悖论。 那么最好别进入;但是它也知道,面对实际进入,在位者容纳严格,优于掠夺。因此,若假定博弈双方追求自身利益最大化,那么对于最后一个市场,进入肯定发生,而且在位者会容纳,不管博弈进程如何。 现在考虑倒数第2个市场,如果进入发生并且在位者在最后一个市场实施掠夺,那么在位者将会在此采用同样战略。但是,最后一个市场的决策独立于倒数第2个市场的决策。因此,若进入发生,在位者会在倒数第2个市场容纳进入。根据相同的逻辑,在位者在所有市场的掠夺可能被依次排除, 从而进入者可以进入任何一个市场。由此,Selten得到了结论:掠夺不是均衡战略。而且,据此逻辑,即使已经看到连锁店对以前每一个进入都实施了掠夺,下一个进入者也会推断出过去的行为不会重复——进入会被容纳。这样,掠夺就无法发挥遏制作用,在位者也就不会采用掠夺策略,掠夺信号由此破解。
基本资料 一名年轻人向公主求婚,国王提出了一个条件,年轻人必须按次序打开五扇门,其中一扇门将会意料不到的出现一只老虎,年轻人打死了老虎就可以得到公主。然後年轻人站到门前开始了推理,假如前四扇我打开後都没有老虎,那老虎肯定在第五扇门中,而国王说过老虎在一扇意料不到的门中,所以老虎肯定不在第五扇门中,依次类推,老虎不存在,最後年轻人冒冒失失开始推门,结果老虎从第二扇门中跳了出来,而且也应了国王的话,它是意料不到的。 只要稍有见识的人,都会马上摇头,说:「哪有这么笨的推理!」但这个悖论的主要关键不是在这五扇门,而是一扇门。正确地说,五扇门只是用来眩惑观众的语法。 国王对年轻人说:「这里有一扇门,门里头会有老虎跳出来,但是你绝对料想不到。」于是年轻人一想:门里头如果有老虎,你都先告诉我了,我怎么会料想不到?所以门后面一定没有老虎。于是年轻人打开了门,老虎果然跳出来了,果然他没料想到。 这个推理错在哪里,就很明显了:为什么年轻人相信「会料想不到」,却不相信「有老虎」? 为什么问题改成「五扇门」之后,会变复杂?因为门后变得「可能有老虎,也可能没老虎」了。但无论如何,「如果年轻人的推理成立」,那麽就算国王把老虎放在第五扇门后,也是「料想不到」,学者门争论的重点只在于:这个推理究竟错在第几步? 主张错在第一步:如果第一步是正确的,那麽后面几步为什么是错的?所以第一步就错了。 主张错在第二步: 故事中的年轻人最后决定相信「没有老虎」。但,国王并不知道年轻人是否会这样,所以的确不可能把老虎放在第五扇门。如果年轻人决定相信「一定有老虎」,那麽在前四扇门都没有老虎之后,第五扇门后的老虎的确就变成「可预料的」了。 既然老虎在第五扇门的话,牠一定是「可预料的」,那麽当你已经开了三扇空门时,情况是怎么样?我们可以试着写成逻辑式子:前提一、老虎不可预料。前提二、老虎如果在第五扇门时,可预料。前提三、老虎不在第五扇门时,就一定在第四扇门。前提四、老虎如果在第四扇门时,可预料。结论:前提互相矛盾。 请注意:这时的逻辑推理中,既然前题互相矛盾,必定有一个以上不成立,那麽可能性就是以下四个其中之一、或是更多:一、老虎可预料。二、老虎如果在第五扇门时,不可预料。三、老虎不在第五扇门时,也不一定在第四扇门。四、老虎如果在第四扇门时,不可预料。二和四自身是矛盾命题,不考虑,三会导致老虎变成薛丁格的猫,也就是半消失状态(年轻人把老虎往前门推是错误的,因为前提中包含「已经开了三扇空门」)。所以可能性只有一个:老虎可预料。但若老虎可预料,那麽显示国王说谎,如果国王可能说谎,那麽老虎也真的有可能消失。 这时的正确结论是:国王一定说谎,但他的谎言可能是「老虎可预料」,却也可能是「根本没老虎」,年轻人只是偏心于一个可能性,结果帮国王圆谎罢了。 主张错在最后一步,把它视为更复杂的数学问题: 如果「不可预料」并不是一种保证,而只意味「高机率」,「有老虎」才是保证,那麽情况又整个改观。可以列成以下状况: 如果青年连猜五次「老虎不在」,则不可预料率100%,当然是最糟的状况。 如果青年连猜五次「老虎在」,这时应将不可预料率一样视为100%。假设国王随便放,因为平均猜错次数是两次,亦即猜错一次要加不可预料率50%才公平。 假设国王随便放,这时青年采用的策略,以: 先两次不猜,再连续猜老虎在:成功率0、0、100、50、0,平均30最高分 先三次不猜,再连续猜老虎在:成功率0、0、0、100、50,平均也是30最高分 但以上两种高分解,前两扇门都是安全门,必须混合下列解答灵活运用 如果第一次就猜老虎在:成功率100、-50、-50、50、0,平均只有10分 如果第二次就猜老虎在:成功率0、100、50、0、-50,平均也有20分 为了便于计算,假设这四种策略年轻人都平均运用,综合以上,老虎放在不同门的平均不可预料率,75%、87.5%、75%、50%、100% 很明显了,这时国王的对应策略,如果把老虎放在失分最低的第五扇门,可能被年轻人豪赌赌中,所以把老虎放在失分次低的第二扇门会是最佳选择,只要把年轻人的猜中率压在20%以下,都可以毫无愧色说是有很高的不可预料率。 这只是一个初步的计算。更精确的计算请运用博弈论。 因此年轻人其实是错在最后一步:他应该从「老虎不存在」这个矛盾的结论,导出国王所谓的『不可预料』其实是指机率,再从机率上推测国王到底把老虎放在第几个门。 主张错在逻辑语意:一个科学事实,海森堡测不准原理可以用来反驳年轻人的推理。也就是说假设老虎在第五扇门后,当年轻人开了四扇门之后,如果质疑第五扇门后的老虎是「可预料的」,国王可以答辩说:「我说老虎不可预料,是在你开门之前」,意即开门(测量)这个动作改变了受测物的性质(不可预料)。如果预计国王会这样答辩,那麽年轻人的五步推理全都是错的。但这种说法也有反对者,他们认为这种答辩虽有科学根据、但那要年轻人也有科学素养才能了解,否则国王会变成秀才遇到兵、有理说不清。 相关链接
冷酷战略简介 “冷酷战略”指,参与人在开始时选择合作,在冷酷战略接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 相关条目 词语 策略 中文冷战——其实是很不错的计策,在三十六计中就是:欲擒故纵。冷酷战略
概念 理髮师悖论又称为罗素悖论,是由伯特兰·罗素在1901年提出的。它的出现是由於朴素集合论对於元素的不加限制的定义。由於当时集合论以称为数学理论的基础,这一悖论的出现直接导致了第三次数学危机,也引发了众多的数学家对这一问题的补救,最终形成了现在的公理化集合论。同时,罗素悖论的出现促使数学家认识到将数学基础公理化的必要性。 内容一个城市里唯一的理髮师只给所有不给自己理髮的人理髮。这个城市不可能存在,因为:如果理髮师不给自己理髮,他需要遵守规则,给自己理髮 如果理髮师给自己理髮,如遵守规则,他不准给自己理髮 换用集合语言:可以把集合分为两类,凡不以自身为元素的集合称为第一类集合;凡以自身作为元素的集合称为第二类集合。显然每个集合或为第一类集合或为第二类集合。设为第一类集合的全体组成的集合。如果是第一类集合,由集合的定义知:应该是的元素,这表明是第二类集合 如果是第二类集合,那么是它自身的元素 二者皆导出矛盾,而整个讨论逻辑上是没有问题的。问题只能出现在集合的定义上。 补救由於罗素悖论的出现所引发的第三次数学危机,公理化集合论势在必行。德国数理逻辑学家策梅洛(Zermelo,1871年-1953年)应用自己的公理系统,使得集合在公理的限制下不会太大,从而避免了罗素悖论。经过改进,这一系统形成了现在被称为ZF系统的公理集合论体系。这个体系至今没有发现悖论。
基本简介 罗素悖论先了解下什么是悖论。悖论(paradox)来自希腊语“para+dokein”,意思是“多想一想”。这个词的意义比较丰富,它包括一切与人的直觉和日常经验相矛盾的数学结论,那些结论会使我们惊异无比。 悖论是自相矛盾的命题。即如果承认这个命题成立,就可推出它的否定命题成立;反之,如果承认这个命题的否定命题成立,又可推出这个命题成立如果承认它是真的,经过一系列正确的推理,却又得出它是假的;如果承认它是假的,经过一系列正确的推理,却又得出它是真的。古今中外有不少著名的悖论,它们震撼了逻辑和数学的基础,激发了人们求知和精密的思考,吸引了古往今来许多思想家和爱好者的注意力。解决悖论难题需要创造性的思考,悖论的解决又往往可以给人带来全新的观念。 罗素悖论 悖论有三种主要形式: 1.一种论断看起来好像肯定错了,但实际上却是对的(佯谬)。2.一种论断看起来 好像肯定是对的,但实际上却错了(似是而非的理论)。3.一系列推理看起来好像无懈可击,可是却导致逻辑上自相矛盾。 形成分类 罗素悖论集合可以分为两类:第一类集合的特征是:集合本身又是集合中的元素,例如当时人们经常说的“所有集合所成的集合”;第二类集合的特征是:集合本身不是集合的元素,例如直线上点的集合。显然,一个集合必须是并且只能是这两类集合中的一类。现在假定R是所有第二类集合所成的集合。那么,R是哪一类的集合呢? 如果R是第一类的,R是自己的元素,但由定义,R只由第二类集合组成,于是R又是第二类集合;如果R是第二类集合,那么,由R的定义,R必须是R的元素,从而R又是第一类集合。总之,左右为难,无法给出回答。这就是著名的“罗素悖论”。 相关案例 罗素悖论世界文学名著《唐·吉诃德》中有这样一个故事:唐·吉诃德的仆人桑乔·潘萨跑到一个小岛上,成了这个岛的国王。他颁布了一条奇怪的法律:每一个到达这个岛的人都必须回答一个问题:“你到这里来做什么?”如果回答对了,就允许他在岛上游玩,而如果答错了,就要把他绞死。对于每一个到岛上来的人,或者是尽兴地玩,或者是被吊上绞架。有多少人敢冒死到这岛上去玩呢?一天,有一个胆大包天的人来了,他照例被问了这个问题,而这个人的回答是:“我到这里来是要被绞死的。”请问桑乔·潘萨是让他在岛上玩,还是把他绞死呢?如果应该让他在岛上游玩,那就与他说“要被绞死”的话不相符合,这就是说,他说“要被绞死”是错话。既然他说错了,就应该被处绞刑。但如果桑乔·潘萨要把他绞死呢?这时他说的“要被绞死”就与事实相符,从而就是对的,既然他答对了,就不该被绞死,而应该让他在岛上玩。小岛的国王发现,他的法律无法执行,因为不管怎么执行,都使法律受到破坏。他思索再三,最后让卫兵把他放了,并且宣布这条法律作废。这又是一条悖论。 由著名数学家伯特兰·罗素(Russel,1872—1970)提出的悖论与之相似:在某个城市中有一位理发师,他的广告词是这样写的:“本人的理发技艺十分高超,誉满全城。我将为本城所有不给自己刮脸的人刮脸,我也只给这些人刮脸。我对各位表示热诚欢迎!”来找他刮脸的人络绎不绝,自然都是那些不给自己刮脸的人。可是,有一天,这位理发师从镜子里看见自己的胡子长了,他本能地抓起了剃刀,你们看他能不能给他自己刮脸呢?如果他不给自己刮脸,他就属于“不给自己刮脸的人”,他就要给自己刮脸,而如果他给自己刮脸呢?他又属于“给自己刮脸的人”,他就不该给自己刮脸。 理发师悖论与罗素悖论是等价的:因为,如果把每个人看成一个集合,这个集合的元素被定义成这个人刮脸的对象。那么,理发师宣称,他的元素,都是村里不属于自身的那些集合,并且村里所有不属于自身的集合都属于他。那么他是否属于他自己?这样就由理发师悖论得到了罗素悖论。反过来的变换也是成立的。 形成影响 罗素悖论十九世纪下半叶,康托尔创立了著名的集合论,在集合论刚产生时,曾遭到许多人的猛烈攻击。但不久这一开创性成果就为广大数学家所接受了,并且获得广泛而高度的赞誉。数学家们发现,从自然数与康托尔集合论出发可建立起整个数学大厦。因而集合论成为现代数学的基石。“一切数学成果可建立在集合论基础上”这一发现使数学家们为之陶醉。1900年,国际数学家大会上,法国著名数学家庞加莱就曾兴高采烈地宣称:“借助集合论概念,我们可以建造整个数学大厦。今天,我们可以说绝对的严格性已经达到了” 可是,好景不长。1903年,一个震惊数学界的消息传出:集合论是有漏洞的!这就是英国数学家罗素提出的著名的罗素悖论。罗素的这条悖论使集合理论产生了危机。它非常浅显易懂,而且所涉及的只是集合论中最基本的东西。所以,罗素悖论一提出就在当时的数学界与逻辑学界内引起了极大震动。德国的著名逻辑学家弗里兹在他的关于集合的基础理论完稿付印时,收到了罗素关于这一悖论的信。他立刻发现,自己忙了很久得出的一系列结果却被这条悖论搅得一团糟。他只能在自己著作的末尾写道:“一个科学家所碰到的最倒霉的事,莫过于是在他的工作即将完成时却发现所干的工作的基础崩溃了。” 1874年,德国数学家康托尔创立了集合论,很快渗透到大部分数学分支,成为它们的基础。到19世纪末,全部数学几乎都建立在集合论的基础之上了。就在这时,集合论中接连出现了一些自相矛盾的结果,特别是1902年罗素提出的理发师故事反映的悖论,它极为简单、明确、通俗。于是,数学的基础被动摇了,这就是所谓的第三次“数学危机”。罗素的悖论发表之后,接着又发现一系列悖论(后来归入所谓语义悖论):1、理查德悖论 2、培里悖论 3.格瑞林和纳尔逊悖论。 问题解决 罗素悖论罗素悖论提出,危机产生后,数学家纷纷提出自己的解决方案。人们希望能够通过对康托尔的集合论进行改造,通过对集合定义加以限制来排除悖论,这就需要建立新的原则。“这些原则必须足够狭窄,以保证排除一切矛盾;另一方面又必须充分广阔,使康托尔集合论中一切有价值的内容得以保存下来。”1908年,策梅罗在自己这一原则基础上提出第一个公理化集合论体系,后来这一公理化集合系统很大程度上弥补了康托尔朴素集合论的缺陷。除ZF系统外,集合论的公理系统还有多种,如诺伊曼等人提出的NBG系统等。公理化集合系统的建立,成功排除了集合论中出现的悖论,从而比较圆满地解决了第三次数学危机。但在另一方面,罗素悖论对数学而言有着更为深刻的影响。它使得数学基础问题第一次以最迫切的需要的姿态摆到数学家面前,导致了数学家对数学基础的研究。而这方面的进一步发展又极其深刻地影响了整个数学。如围绕着数学基础之争,形成了现代数学史上著名的三大数学流派,而各派的工作又都促进了数学的大发展等等。 以上简单介绍了数学史上由于悖论而导致的三次数学危机与度过,从中我们不难看到悖论在推动数学发展中的巨大作用。有人说:“提出问题就是解决问题的一半”,而悖论提出的正是让数学家无法回避的问题。它对数学家说:“解决我,不然我将吞掉你的体系!”正如希尔伯特在《论无限》一文中所指出的那样:“必须承认,在这些悖论面前,人们目前所处的情况是不能长期忍受下去的。人们试想:在数学这个号称可靠性和真理性的模范里,每一个人所学的、教的和应用的那些概念结构和推理方法竟会导致不合理的结果。如果甚至于数学思考也失灵的话,那么应该到哪里去寻找可靠性和真理性呢?”悖论的出现逼迫数学家投入最大的热情去解决它。而在解决悖论的过程中,各种理论应运而生了:第一次数学危机促成了公理几何与逻辑的诞生;第二次数学危机促成了分析基础理论的完善与集合论的创立;第三次数学危机促成了数理逻辑的发展与一批现代数学的产生。数学由此获得了蓬勃发展,这或许就是数学悖论重要意义之所在吧,而罗素悖论在其中起到了重要的作用。 罗素悖论理性不能回答关于其自身的问题,这个问题在康德时期就发现了。逻辑存在无法弥补的漏洞,却是人了解世界的唯一途径。到头来你会发现,不是否定理性就是否定信仰。因为所谓唯心唯物之争都是建立在这样不完备的逻辑体系上的纯粹理性科学。既然理性无法对其自身做出判断,那么选择立场就不能以理性为依据,从而变成一种实质上的迷信。当然如果你坚持要说自己的立场是合乎所谓的科学或实践的,那么其实你既不属于唯物也不属于唯心,本质上只是一种泛经验主义或者泛逻辑主义罢了。当然,这里的逻辑主义当然不是罗素的那个,只是一个形象点的称呼而已。 异己词悖论和罗素悖论还有其它的不同吗? 思考这个问题的动机原是这样:是否所有能导致两难推理的悖论(包括一些所谓的语义学悖论)都有相同结构?如果不是,能不能把它们按照逻辑结构来分类?从而能够更加清晰地看清每一类悖论产生的根源。比如罗素悖论,用符号表示出来,就可看出,它用了这样一个定义模式:x是S的,如果x不是x的。(稍微严格一点写成这样:xRS,如果非xRx.R为一个二元谓词。)而在定义S时,S本身又可以用它自己的定义来判定,即可以把定义中的x换成S,导致这样一个语句:S是S的,如果S不是S 的。注意在定义中的两个语句互为充要条件,所以原来的定义中就蕴含了一个“P等价于非P”的结论,从而导致两难推理。这种定义模式本身是逻辑中的漏洞,康托的朴素集合论正因为没有防范的机制而陷入了这个逻辑漏洞,才导致了集合论形式的罗素悖论。罗素悖论已被消除,自己包含自己的集合是不可能存在的。 公理体系 罗素悖论不加定义的概念在类的公理体系中,有一些基本的概念是不加定义的,人们只能从其客观含义上给予解释,但这样的解释仅仅起到帮助理解这些概念。数学中研究的任何一个客体对象都称为一个类。类的概念是没有任何限制。类与类之间可能存在着一种称为属于的关系,类A属于类B记为AinB,此时也称类A是类B的一个元素(简称为元)。人们可以把类理解成为是由若干元素组成的一个整体。一个类是否是另一个类的元素是完全确定的,这就是类元素的确定性。类A如果不是类B的元素,则称A不属于B,记为AnotinB。另一个不加定义的概念就是:类总是具有一定的性质,人们常以P(x)表示类x具有性质P。人们可以把性质理解为“关于类的一句表述”。人们还认为逻辑学中的基本概念与基本知识是类理论的基础。 类的外延公理公理Ⅰ(外延公理)forallA,B(A=Biffforallx(xinAiffxinB))。公理Ⅰ的含义是:两个类“相等”的充要条件是它们的元素完全相同,这就是说,类完全由其元素确定。类的所有元素可以通俗地称为它的外延,正因如此,公理Ⅰ被称为外延公理。由此人们可以定义:定义1.1两个类A、B,如果它们的元素完全相同,则称这两个类是相等的,记为A=B。因此,类完全由其外延确定。由外延公理人们可以得出:类中的元素是不会重复出现的(准确地说,重复出现的元素仍然被当作一个元素),这就是类元素的互异性;类中的元素是不计其出现在类中的顺序的,这就是类元素的无序性。一个类可能由若干元素组成,而它本身又可能成为另外的类的元素,这就是类元素的相对性。 类的内涵与罗素悖论一般地说,类中的元素总是具有某种共同的性质的,这就是类的元素的同质性。一个类的所有元素所共同具有的、而且是这个类的元素所独有的性质(也就是说不是该类的元素就不具有该性质)通俗地称为该类的内涵。类的内涵与外延之间存在着直观的“反比关系”:类的内涵越多,其外延越小;内涵越少,其外延越大。对于类的内涵问题,人们通常希望:任给一个性质,满足该性质的所有类可以组成一个类。但这样的企图将导致如下的悖论:罗素悖论设性质P(x)表示“xnotinx”,现假设由性质P确定了一个类A----也就是说“forallx(xinAiffxnotinx)”。那么现在的问题是:AinA是否成立?首先,若AinA,则A是A的元素,那么A具有性质P,由性质P知AnotinA其次,若AnotinA,也就是说A具有性质P,而A是由所有具有性质P的类组成的,所以AinA。罗素悖论还有一些更为通俗的描述,如理发师悖论:理发师悖论某理发师发誓“要给所有不自已理发的人理发,不给所有自己理发的人理发”,现在的问题是“谁为该理发师理发?”。首先,若理发师给自己理发,那他就是一个“自己理发的人”,依其誓言“他不给自己理发”;其次,若“他不给自己理发”,依其誓言,他就必须“给自己理发”。而书目悖论也是罗素悖论的一种通俗表达形式。 罗素悖论真类与集合为解决此类悖论,人们把类区分为两种:定义1.2如果存在类B,而类A满足条件“existsB(AinB)”,则称类A为一个集合(简称为集),记为Set(A)。定义1.2说明,一个集合是类的一种,它可以成为其它类的一个元素,这也正是集合的"严格"定义。有另一种集合的定义:已存在一个类B,其中凡是符合属性P(x)的,可以构成一个类A。类A则是一个集合,或者说是B的一个子类。但对此种定义,人们可以提出质疑,不能保证A不是真类。但人们还是乐于接受该定义的。但定义说不上严格。集合能进行各种类运算。真类不是集合的类就是真类。真类是一种能以自身作为元素的类,对于真类,类运算并不一定都能进行。一个真类却不能成为其它类的元素。因此人们可以理解为“本性类是最高层次的类”。罗素悖论等于用反证法证明了真类的存在。但真类是抽象难理解的。但是,“类和集合是非常一般的概念,什么是集合的问题是不能彻底回答的。只有随着数学实践来确定哪些类是集合,哪些类是真类,任何时间,总有一些类无法确定其到底是不是集合。” 类的内涵公理公理Ⅱ(内涵公理)设P是一个性质,则existsA(forallx(xinAiffP(x)wedgeSet(x)))。公理Ⅱ的含义是:满足一定性质的所有集合可以组成一个类。内涵公理能够解决罗素悖论:令P(x)为“xnotinx”(称为罗素性质),依内涵公理,人们不能确定所有满足P的类能否构成一个类,人们只能确定满足P的所有集合能够构成一个类A(下面提到的性质1.1),人们有结论“AinAiffP(A)wedgeSet(A)”,即“AinAiffAnotinAwedgeSet(A)”。此时不会出现悖论,只能得出结果:A不是集合,因此A是本性类,人们把这个类称为罗素类。对于内涵公理,任给一个对所有集合都满足的性质P,如P(x)=Set(x),则有:性质1.1所有的集合构成一个真类。人们把所有集合构成的类称为极限类(真类),它是类理论所承认的“最大的”类。由公理Ⅰ(外延公理)、公理Ⅱ(内涵公理)组成的公理体系人们称为罗素公理体系,这是关于类的理论的最基本的公理体系。 罗素公理体系与罗素悖论罗素悖论产生的原因,是把真类当成集合。可以说,罗素公理体系在两方面避免罗素悖论:第一,不存在包含自身的集合(包含自身的类是真类)。第二,“所有”集合的总体不是集合!而是一个真类。因为“所有”一词,包含了自身。以书目悖论为例,根据罗素公理体系,所有符合条件的书的确构成了一个集合,因为它们可以与其它的书进一步构成更大的整体(集合的定义)--比如它们和不符合条件的书共同构成了图书馆里所有的书(类)。问题“这本书要记下自己的书名吗?”,即是,它包含自己吗?已经没有回答的意义。因为根据内涵定义,不存在包含真类的集合。所以实物上不存在里面提到的那一本目录书(也有人认为那是一个非法的集合,一个集合要包含自身,但又要和集合内其它元素相区别,是不可能的)。但注意,这一抽象概念却是存在的,它是一个真类。在理发师悖论里,理发师其实划出了一个真类。如果理发师修改一下自己的说法:“除了我理发师本人之外,我给所有不给自己理发的人理发”,悖论就被避免了。因为理发师此时定义了一个集合(根据声明,他不在自己定义的服务群里)。注意:罗素公理体系只是“避免”了罗素悖论,并没有解决罗素悖论。罗素公理体系的提出,是保证不产生悖论,又要求这些公理的范围足够宽,能容纳全部数学。就是说要给数学提供足够的集合。 相关词条 青蛙效应,逆反效应,镜面效应,沼气,活字印刷术,指南针,罗盘,磁场,礼花。 参考资料1、http://www.cas.ac.cn/html/Dir/2002/01/14/7804.htm2、http://www.confuchina.com/04%20zhishilun/zhuangwen.htm3、http://www.hongen.com/edu/kxdt/sxwg/kf021401.htm