概述博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来指导生活决策的方法。 博弈策略是指每个博弈方在进行决策时可以选择的方法、做法等。 谈到博弈策略问题,可以说在我国传统文化中,包含有许多精妙的博弈策略。许多成语及成语典故,就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。当然,博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。1 分类博弈策略,有纯策略和混合策略之分。 1、纯策略是指参与人在博弈中可以选择采用的行动方案。 [1]2、混合策略是在纯策略空间上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。 目录 1 参考文献 参考文献 ↑ 从日常生活看"博弈论".作者:叶德磊
目录 1理论提出 理论提出 十七世纪后期,艾萨克·牛顿(Isaac Newton)、戈特弗里德·威廉·莱布尼茨(Gottfriend Wilhelm Leibniz,1646-1716)创立微积分学,成为解决众多问题的重要而有力的工具,并在实际应用中获得了巨大成功,然而,微积分学产生伊始,迎来的并非全是掌声,在当时它还遭到了许多人的强烈攻击和指责,原因在于当时的微积分主要建立在无穷小分析之上,而无穷小后来证明是包含逻辑矛盾的。 1734年,大主教乔治•贝克莱(George Berkeley) “渺小的哲学家”之名出版了一本标题很长的书《分析学家;或一篇致一位不信神数学家的论文,其中审查一下近代分析学的对象、原则及论断是不是比宗教的神秘、信仰的要点有更清晰的表达,或更明显的推理》。在这本书中,贝克莱对牛顿的理论进行了攻击。例如他指责牛顿,为计算比如说x2的导数,先将x取一个不为0的增量Δx,由(x + Δx)2 − x2 ,得到2xΔx + (Δx2) ,后再被Δx除,得到2x + Δx,最后突然令Δx = 0 ,求得导数为2x 。这是“依靠双重错误得到了不科学却正确的结果”。因为无穷小量在牛顿的理论中一会儿说是零,一会儿又说不是零。因此,贝克莱嘲笑无穷小量是“已死量的幽灵”。贝克莱的攻击虽说出自维护神学的目的,但却真正抓住了牛顿理论中的缺陷,是切中要害的。 简介数学史上把贝克莱的问题称之为“贝克莱悖论”。笼统地说,贝克莱悖论可以表述为“无穷小量究竟是否为0”的问题:就无穷小量在当时实际应用而言,它必须既是0,又不是0。但从形式逻辑而言,这无疑是一个矛盾。 对于无穷小量所带来的数学本身非逻辑非严谨性的问题,那些曾具体从事微积分研究的数学家们早就有过这样或那样的思考,在他们之间并展开过激烈的讨论和争论。从数学的角度看,如何较好地理解这一问题或许可以被看成一个纯技术性的问题;但是,从文化的角度看,我们又只有从更为广泛的角度去进行考察,特别是密切联系当时在欧洲人生活中占重要地位的基督教文化,才能更好地理解围绕无穷小运算所展开的激烈争论及其内涵。 人物简介 英国主观唯心主义哲学家、主教。1685年3月12日出生于爱尔兰基尔肯尼郡,1753年1月14日卒于牛津。少年早熟,15岁考进都柏林三一学院,1704年获学士学位,1707年获硕士学位,留校担任讲师、初级研究员。1709年刊行《视觉新论》,1710年发表《人类知识原理》,1713年出版《海拉斯和斐洛诺斯的对话三篇》,均成为当时英国各大学热烈讨论的问题。1734年被任命为爱尔兰基尔肯尼地区主教,任职18年,仍致力于哲学的思辨。1752年移居牛津附近的新学院。贝克莱对于心理学的贡献,主要是他的《视觉新论》,断定经验来自视觉、肤觉的客体、方位、大小和形状。这本书主要企图证明人们的视觉经由什么途径来知觉客体的距离、体积和位置;并探讨视觉的观念和肤觉的观念有什么差异,是否有共同的观念。他认为由空间知觉来判断距离的远近和物体的大小,全凭人们的知觉经验。物体投射到眼睛网膜的视象受方位、空气透视和相对大小的影响,这已是人所共知的常识。还提出眼的辐合作用,眼的投射域和眼的调节作用(紧张度)。这些都符合现代眼科生理的事实。 贝克莱哲学的基本观点表现在以下几个方面: 第一,物质就是“虚无”。贝克莱深知物质概念是一切唯物主义和无神论者的基石,因此,他千方百计地攻击唯物主义的物质不说,否认物质的客观实在性,以图达到他取消物质的目的,宣称物质就是“虚无”。他说:关于“物质”或“有形实体”的学说,是“怀疑主义”的主要支柱,同样,一切“无神论”和“不信宗教的渎神的企图,也是建立在这个基础之上的。……物质的实体从来就是“无神论者”的挚友,这一点是无需多说的。他们的一切古怪系统,都明显地,必然地依靠它;所以一旦把这块基础去掉,整个建筑就不能不垮台”。他认为,物质是一个虚构的词,不表示任何实在的东西,在人的心中也没与之相应的观念。由此得出结论,物质就是“虚无”,他讥笑唯物主义者说:“假如你愿意的话,你可以把物质一词用成和别人所用的无物一词的意义一样”。贝克莱就是这样攻击唯物主义的,但是,物质是不依赖于人的感觉的客观存在,是人类长期实践所证实的,决不是贝克莱可以取消得了的。 第二,“存在就是被感知”。贝克莱认为,人们认识的对象就是观念,观念并不反映观念之外的任何事物,而且观念之外就没有任何事物,人们平常所说的事物,不过是观念的各种不同的结合而已。例如,我们看到一个圆的形状、红的颜色,嗅到香的气味,把这些感觉集合起来,人们就用苹果这个名称来表示它,并把它当做一个单独事物来看待。由此得出结论,事物就是“观念的集合”。然而,观念本身并不能独立存在,要有一个能感知它们的主体,这个主体就是“一个能感知的主动存在,要有一个能感知它们的主体,这个主体就是”一个能感知的主动实体,就是我所谓的心灵、精神、灵魂或自我。……观念只存在于这个东西之中,或者就被这个东西所感知。主观唯心主义在我国也同样存在,明代的王阳明(1472——1528),集宋明时期主观唯心主义之大成,有四个字就可以概括他的全部哲学叫做“心外无物”。就是说,万事万物,包括月亮、太阳……都存在于他的心中。这种主观唯心主义显然是站不住脚的,它不可避免地要陷入唯我论的可悲结局,既然,世界只存在于他的感觉中,那么世界上也就只有他一人是存在的了,这是何等荒谬呢!如果我们质问主观唯心主义者,既然你认为世界上的一切都是你的感觉,那么当你还没出世之前也就是还没有你的感觉的时候,生你的父母是不是客观存在的呢?对于这样的问题他们是无法回答的。 注:以上反驳是无力的。要了解贝克莱的思想,绝不可把物质与存在(或非物质与不存在)混为一谈。贝克莱的理论是“非物质论”(Immaterialism),认为世界上存在的只有能进行思考的心灵(Mind)和不能进行思考、只存在于心灵之中的观念(Proception)。物质(Material)是不存在的,因为它被证明是一种没有性质的物理客体(参看贝克莱的早期著作)。我们能够感知到主观存在的观念,经验到作为客观实体的心灵。贝克莱的思想绝不等同于王阳明的思想,王阳明有很大的唯我论倾向,但贝克莱是反对唯我论的。贝克莱认为:我们所感知的只是观念,我感知不到的观念,对于我的心灵来说就是不存在的,但对于别的感知到它的心灵来说,这个观念就是存在的,因为所谓的“心灵”并不是仅仅指我的心灵,而是指所有的心灵,包括永恒不朽的心灵——God,God给予所有观念以感知,于是它们即使不为人所感知,也是存在的,别忘了贝克莱可是个有神论者。 对于生身父母的问题,我们可以做如此解释:我们在没有出世之前自然经验不到父母的心灵,父母的心灵实体对于我们的心灵来说就是不存在的,但这并不意味着对于其他心灵(比如祖父祖母、父母的朋友们等等)来说我们的父母也是不存在的,他们可以经验到我们的父母的心灵实体,因此对于这些心灵,我们的父母客观存在。哪怕我们的父母就是Adam和Eve,还会有God这个永恒心灵来经验他们的心灵。贝克莱不反对心灵的客观存在,但他强烈反对物质的客观存在。事实上,刚才所反驳的仅仅是贝克莱本人也不赞同的唯我论,而不是贝克莱的真正思想 在我们还是婴儿的时候,我们的心灵具有了一定的感知能力。我们可以慢慢知道,哪些观念的集合用“桌子”这一词汇称呼,那些观念的集合用“椅子”这一词汇称呼,哪些似乎是观念的集合的事物被称为“父”、“母”或者“小朋友”。渐渐地,对我们心灵中经验的能力趋于成熟时,我们会发现,“父”、“母”以及“小朋友”这些词汇所指称的事物与观念有很大区别,通过进行经验,我们会发现,和桌子与苹果相比,他们是能动的,至少与本人十分相似。于是我们便可以做出判断:“父”、“母”、“小朋友”不是观念,而是一种与观念截然不同的事物——心灵。 贝克莱悖论与第二次数学危机第二次数学危机导源于微积分工具的使用。伴随着人们科学理论与实践认识的提高,十七世纪几乎在同一时期,微积分这一锐利无比的数学工具为牛顿、莱布尼兹各自独立发现。这一工具一问世,就显示出它的非凡威力。许许多多疑难问题运用这一工具后变得易如翻掌。但是不管是牛顿,还是莱布尼兹所创立的微积分理论都是不严格的。两人的理论都建立在无穷小分析之上,但他们对作为基本概念的无穷小量的理解与运用却是混乱的。因而,从微积分诞生时就遭到了一些人的反对与攻击。其中攻击最猛烈的是英国大主教贝克莱。 [1]
颤抖手精炼均衡(trembling hand perfect equilibrium) 概念 “颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中,颤抖手精炼均衡每个局中人都有一定的犯错误的可能性(类似一个人用手抓东西时,手一颤抖,他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人i要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小,但大于0)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。 从博弈论中我们知道,泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来,泽尔腾(1975)假定,在博弈中存在一种数值极小但又不为0的概率,即在每个博弈者选择对他来说所有可行的一项策略时,可能会偶尔出错,这就是所谓的“颤抖之手”。因之,一个博弈者的均衡策略是在考虑到其对手可能“颤抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看,在演进博弈论中,最初的演进稳定性的出现,并不完全来自博弈双方的理性计算,而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路,我们也可以认为,人们对一种习俗(演进稳定性)的偏离,也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。 价值 为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态s1和s2下,每个委托人的收益如下: 状态s1(坏) 状态s2(好) β1 β2 β1 β2 α1(c1,c2) (d1,a2) α1(d1,d2) (e1,b2) α2(a1,d2) (b1,b2) α2(b1,e2) (c1,c2) 其中,00单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出: 状态s1(坏) α1 β1 ( U1, U2) β2 ( U1-M) α2 (-M, U2) (-M,-M) 状态s2(好) α1 β1 ( U1, U2) β2 ( U1,-M) α2 (-M, U2) ( U1+l1, U2+l2) 这样,在好的环境s2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+l1, U2+l2);而在坏的状态s1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈,我们发现在状态s2中,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( U1, U2)升至( U1,+l1, U2+l2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。
定义 在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争, 即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。 下面给出两个重要定义: 定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。 定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成均衡, 则称该策略组合具有子博弈完美性。 在重复博弈中, 可信性同样是非常重要的, 也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据, 又由于长期利益对短期行为的制约作用, 因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的, 从而使博弈的均衡结果出现更多的可能性。 特征 1、阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构。 2、所有参与人观察到博弈过去的历史。3、参与人的总得益是所有阶段博弈得益的贴现值之和。 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的策略可以选择,均衡结果可能与一次博弈大不相同。重复博弈是指同样结构的博弈重复许多次。当博弈只进行一次时,每个参与人都只关心一次性的支付;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前的利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响到博弈均衡的结果。1.无限次重复博弈:下面用一个关于产品定价博弈的例子分析重复博弈。产品定价博弈厂商B低价高价厂商A低价高价12,1220,44,2015,15 是两个厂商A和B定价的支付矩阵,从中可以看出:在一次性博弈中中,厂商A和厂商B都存在上策,上策均衡是双方都定低价。从参与人行为看,由于博弈可以重复无数次,博弈双方为了长期利益有时间进行试探性出价。在第一次博弈时出高价以寻求竞争对手的合作,一旦对局人为了短期利益采取不合作行为,那么就会建立该对局人是不可信任的信念,在下一次的博弈中都采取不合作的低价行为,使对局人的长期利益受损。可见,厂商B在第一次博弈中由于不合作策略得到的高收益会在以后博弈中因A的报复性策略而抵消,甚至在重复博弈若干次后出现损失。假如厂商A开始制定的高价策略,从支付矩阵得到厂商B若也定高价,其每次博弈的支付分别为(15,15,15...);若厂商B制定低价,则在第一次博弈中获得高收益,但是随后会由于厂商A的低价行为而使其受损,各次博弈的支付分别为(20,12,12...)。厂商A的这种策略被称为“以牙还牙”策略,这种策略是A在初始选择合作,如果B合作,那么A也会一直合作下去;若B在某一次博弈中选择不合作,那么A在以后博弈中都采取不合作策略。“以牙还牙”策略意味着任何一个参与人的一次性不合作将会引起永远的不合作。所有参与人为了长期利益,使得无限次重复的非合作博弈产生合作解。2.有限次重复博弈:假定重复有限的N次,这意味着所有参与人都能预测到最后一次(第N次)的收益。在第N次博弈中,各参与人都知道对方的“以牙还牙”,但是他也知道如果在这次博弈中自己选择低价的上策,将使自己受益而其他参与人受损,且也不会留给对方报复的机会(博弈到第N次结束)。所有参与人都明白这一点,因此在最后一次博弈中将都采取低价策略,这与一次博弈的上策均衡结果相同。在现实中,市场竞争者很难弄清重复博弈的结构。厂商很难预期自己在什么时候会结束经营,也不清楚与对手的竞争何时是第N次博弈。因此,只要竞争时期足够长,竞争的双方都预期未来还要进行很多次博弈,那么,竞争的结构就可能近似于无限次重复博弈,使得厂商在竞争中出现相互合作的局面。序列博弈 在实践中,博弈者在选择行动时可能有先后顺序或某些对局者可能率先采取行动,这种博弈被称为序列博弈。1.先行者优势:厂商生产甜味饼干的收益10要高于生产脆味饼干的收益8。假定两个厂商同时独立的做出生产决定,他们都愿意推出甜味饼干——结果是两家收益都受损厂商2脆甜厂商1脆甜—3,—38,1010,8—3,—3可见,在序列博弈中,先行者可能占据一定的有利地位,这就是先行者优势。厂商1为获得更大收益,会选择推出甜味饼干,使得厂商2只能选择收益较低却是最优的策略——推出脆味饼干。2.博弈的扩展形式:常用博弈的扩展形式来分析序列博弈,它用决策树的形式表示可能的行动,并在各枝的结束处给出各行动的支付。 脆-3,-3脆厂商2厂商1(2)甜8,10(1)脆10,8甜厂商2(3)甜3,-3 博弈的扩展形式的解一般用逆推法推导,由最后的收益逆向归纳,倒推到初始节点1处做出最后决策。例子以下我们用一个产品定价的例子讨论重复博弈,给出了一次性完全信息静态博弈的收益矩阵。 A、B两个参与人都有两种定价待选择:定高价或定低价。如果两个参与人都定低价,则每个参与人的收益均为20个单位;如果两人都定高价,则每人的收益均为30个单位;如果其中某一参与人定低价,而另一参与人定高价,则定低价的参与人有占有更多的市场份额获得40个单位的收益,定高价的参与人由于失去一部分市场份额而只获得10个单位的收益。显然,在这个一次性完全信息静态博弈中,两个参与人均有占优策略,占优策略均衡为A、B双方都定低价。 如果A、B之间的定价博弈是多次进行的,那么,问题就不是如此简单了。我们先来分析博弈重复次数为无限时的情况。 如果A、B双方都选择合作,都保持定高价,则双方在每个阶段的收益均为30个单位,记为(30,30,30,…);如果A、B中有一方(如A)采取投机行为,在实际定价中选择不与对方合作,在第一阶段就通过选择定价策略使得选择高价策略的对手B受损,则受损的一方B一定会在第二阶段及其以后的定价中也选择低价策略,加以报复,这样一来,首先选择不合作的一方A在个阶段的收益为(40,20,20,…),显然,其总收益远远小于合作、维持高价情况下的总收益。因为,首选选择不合作的一方A,只是在第一阶段获得了“额外”收益,但在以后个阶段的收益将因为对手B的报复性选择而减少,并且,重复若干此后,首先选择不合作的一方A将得不偿失。 在这里,B选择的策略称为“冷酷策略”(grimstrategies)。冷酷策略是指重复博弈中的任何参与人的一次性不合作将引起其他参与人的永远不合作,从而导致所有参与人的收益减少。因此,所有参与人具有维持合作的积极性。我们再来讨论博弈重复次数为有限时的情况。 重复次数有限博弈与重复次数无限博弈之间的惟一区别,是所有参与人都可以明确无误地了解重复的次数,即可以准确地预测到最后一个阶段博弈。而在最后阶段的博弈中,任何一个参与人选择不合作,不会导致其他参与人的报复。因此,所有参与人都会在最后阶段的博弈中选择自己的占优策略,那就是不合作。上例中,在最后阶段博弈中选择低价是所有参与人的占优策略。 既然所有参与人都会在最后阶段选择不合作,那么,在倒数第二阶段博弈中任何参与人也就没有必要担心由于自己选择不合作,导致其他参与人在最后阶段博弈中的报复。因此所有参与人在倒数第二阶段博弈中,也都会选择不合作。即在倒数第二阶段博弈中,所有参与人都会选择占优策略。 由此类推,可以得出以下结论:在阶段性博弈存在惟一的纳什均衡时,阶段博弈的纳什均衡解就是重复次数有限博弈的唯一子博弈精炼纳什均衡解。即重复次数有限博弈的每个阶段的均衡解都是一次性博弈的纳什均衡解。注意,上述推论成立的前提条件是阶段性博弈纳什均衡的惟一性。 [1]
策略空间(Strategy space) 目录 1 什么是策略空间 什么是策略空间 策略空间(strategy space)是指博弈各方可供选择的策略或行为的集合。比如,一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。 Strategy直译应为战略,不过战略一词对大多数博弈未讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多,博弈就越复杂。 策略空间是一个小作品。你可以通过或修订扩充其内容。
抽彩悖论(Lottery paradox) 目录 1 什么是抽彩悖论 什么是抽彩悖论 抽彩悖论又称凯伯格悖论,由H·凯伯格(H.Kyburgm)在他的《合理信念逻辑的概率》一书中所表述的悖论:我合理地相信在一百万张彩票中有一张将中彩。但我并不合理地相信1号票将中彩,也没有理由相信2号票将中彩。这一过程可以继续下去,以至最终也没有理由相信任何单独一张票将中彩。于是悖论出现了,因为我确实相信有一张票将中彩。这一悖论涉及到部分信念和完整信念之间的关系。 该悖论表明基于概率的信念表达方式与信念推理规刚之间的不一致性。抽彩悖论涉及到在命题与证据逻辑关系不确定的条件下信念表达和推理的问题。 抽彩悖论是一个小作品。你可以通过或修订扩充其内容。
简介 单峰偏好理论所谓单峰偏好,是指选民在一组按某种标准排列的备选方案中,有一个最为偏好的选择,而从这个方案向任何方面的偏离,选民的偏好程度或效用都是递减的。如果一个人具有双峰或多峰偏好,则他从最为偏好的方案偏离时,其偏好程度或效用会下降,但之后会再上升。布莱克证明了如果假设各个选民的偏好都是单峰偏好,那么最终投票的结果就可以避免阿罗悖论,社会成员个人的偏好之和可以得出确定的唯一的社会总体偏好,而这种社会总体偏好恰好是个人偏好处于所有选民偏好峰的中点上的选民,高于他偏好的选民数量和低于他偏好的选民数量正好相等,这也就是著名的中间投票人模式(medianvotermodels)。布莱克由于对这个问题的开创性研究而被戈登·塔洛克(GordonTullock)称为公共选择学派的奠基人。 公共选择学派是以经济学方法研究非市场决策问题的一个重要学派,其主要代表人物是詹姆士·布坎南、戈登·塔洛克。公共选择学派由经济学家创立。它的诞生可以追溯到阿罗(KennethJ.Arrow,1921)1951年发表的《社会选择与个人价值》。公共选择理论研究的内容与公共行政学、公共政策和政治学重迭。从这个意义上说,公共行政学愿将公共选择学派囊括入自己的“势力”范围。塔罗克(GordonTullock,1922)和布坎南(JamesBuchanan,1919-)于1965年成立了公共选择学会(PublicChoiceSociety),他们认为公共选择理论是用经济学的研究方法去研究习惯上由政治理论家研究的问题。现在的公共选择年会大约有16个国家的300名学者参加。公共选择学派的代表人物及作品除阿诺外有:布坎南与塔洛克合著《赞同的计算:宪法民主的逻辑基础》(1962);科斯(RonaldHarryCourse,1910-)《社会成本问题》(1960);荡斯(AnthonyDowns,1930-)《民主的经济理论》(1957);布坎南(WilliamNiskanen,1933-)《官僚政府与代议政府》(1971);奥圣(MancurOlson,1932-1998)《集体行动的逻辑:公共商品与团体理论》(1965)。 类型 邓肯·布莱克认为,通过对个人的偏好进行适当限制,使其适合于某一种类型,则多数决策结果就满足可传递性假定。布莱克对个人偏好提出的特殊类型就是具有单峰形状。这种单峰形状的个人偏好类型可被说明如下(表1): 单峰偏好理论 人们可以对A、B、C三种选择目标进行比较:当A与B相比较时,B将胜于A;当B与C比较时,B仍将胜于C;当A与C比较时,C将胜于A。这样,在以上例子中,给定一个特殊的个人偏好结构,多数决策的结果满足可传递性,社会选择的偏好顺序将是BpCpAp(这里p表示“偏好(prefer)”,即前者比后者更可取)。为什么称上表所示的个人偏好类型为单峰型呢?可以用下图加以说明。 (图1) 单峰偏好理论 假定有三个人l、2、3,每人共同面临A、B、C三种选择,A代表政府高水平的预算,B代表中等水平的预算,C代表低水平的预算。每个人的偏好顺序以他对于这三个选择方案的排列顺序表示出来。表4-1代表这三个人的偏好顺序: 单峰偏好理论 (图2) 单峰偏好理论 图2表示表2上的个人偏好结构,而图1表示表1上的个人偏好结构。图2与图1的区别在于,在图4-2中,三个人的偏好线都是单峰形状的。单峰偏好意味着人们最理想的结果只有一个,对于这个惟一的最理想目标的偏离,无论是正的方向,还是负的方向,都是坏事情,都将使他们的福利水平降低。例如,对于个人1来讲,如果选择方案依照A、B、C的顺序排列,他会认为境况逐渐变坏;对于个人2来讲,如果选择方案依照A、B、C的顺序排列,他会认为境况逐渐变好;对于个人3来讲,只要偏离了B方案,不论是向哪个方向偏离,他都认为境况变坏。而在图4-1中,个人3的偏好线是双峰形的(多峰偏好),该线先是从某一峰顶上往下降,然后又往另一峰顶上升。多峰偏好则意味着人们最理想的结果不止一个。最初,当人们偏离其最偏好的选择目标时,境况会因此变坏,若继续沿着这个方向运动,其境况则会最终变好。 在现实中,多峰偏好可能是在许多问题上所出现的共同现象。比如,一位对公立学校预算计划进行投票表决的投票人就有可能具有多峰偏好。假定投票人既可以将孩子送到私立学校就学,也可以送到公立学校就学,并假定决定投票人在送孩子到哪种学校就学态度上的因素,在于公立学校的质量,而公立学校的质量又与其预算规模正相关。 该投票人的第一选择可能是将他的孩子送到私立学校。如果他这样做,尽量压缩公立学校的预算开支就会符合他的利益,这是因为他虽然为公立学校缴纳税款,但是并没有从中获得直接利益。因此,他的第一选择就是制定符合最低质量公立学校的预算计划。如果假定学校预算所需要的税收足以允许建立一所中等质量的公立学校,投票人缴纳税收之后的收入在支付孩子私立学校就学费用上发生困难,或者认为送孩子到私立学校就学不再划算,他就会转而支持一个可以维持高质量的公立学校的预算,把孩子送到公立学校就学。所以,他的第二选择是一个尽可能提高公立学校教学质量的预算方案,而维持中等质量的公立学校的预算,对他来讲,是一种最差的选择。 一些国家的公民在对待战争问题上,有时也会出现多峰偏好的倾向。例如在越南战争时期,许多美国公众更倾向于完全投入战争(包括使用核武器)或完全不参与战争,而对进行一场有限战争和局部战争不太感兴趣。可以看出,这些公民对于极端性解决方案,而不是折中性解决方案表示出更大的偏好。也正是由于多峰偏好的存在才使得在多数票规则下有可能无法达成政治均衡。 结论 对比多峰偏好,对于单峰型的个人偏好结构可以有以下结论: 1、在单峰型的个人偏好结构中,多数决策的结果具有稳定性。在2的表式中,社会偏好不具有传递性,是循环的,于是,投票结果是不确定的。现在,在单峰偏好下,循环被打破了,从而产生了一个稳定的结果。 单峰偏好理论选民在投票2、单峰偏好虽然克服了投票悖论,但它违反了阿罗关于“无限制的定义域”的假定,即单峰偏好是依靠把个人偏好限制在单峰状态为前提的。 3、单峰状态究竟在实际中是否存在?布莱克认为,在大多数场合,个人的偏好结构会呈现出单峰形。为什么呢?由于A代表低水平的预算,B代表中等水平的预算,C代表高水平的预算,在概率上说,CpApBp的个人偏好顺序出现的可能性很小,因为绝大多数人不会既认为高额预算比低额预算好,又认为低额预算比中等规模的预算好。 1970年,图洛克与坎贝尔(Campbell)在《小型投票体系的计算机模拟》(Computersimulationofasmallvotingsystem)一文中指出,在现实世界中,投票者的人数总是大大超过供投票选择的社会状态的个数的。这时,出现投票悖论的概率是如此的小,以至于在实际中可以不考虑它。这时,出现一致的概率就很高,而再提出或拥护另一个选择方案的成本会高于该方案能带来的利益。如果实际的多数投票结果确实靠近中间状态,则该结果将被大家所接受。虽然,图洛克的分析是否有效,这个问题是有待于经验证明的,但是,可以肯定的是,图洛克这一段话是非常有助于说明直接民主投票制与间接投票制之间的差异的。 1、在直接民主投票制下,参加投票的人数总是大大超过被投票表决的方案个数的,这时出现投票悖论概率很小。 2、在代表制投票方式(间接投票制)下,如在英国,投票者总是限于保守党、工党与别的大党之间,由于投票者数目减少了,就使投票难以达到一致的结果。 这说明,在一个社会可供选择的状态的个数已定的前提下,决策程序越是不民主,则投票结果就越是不确定、不稳定,政府政策就越是易变,于是,也会越是依赖于专制型决策。[1]
概述动态博弈(dynamic game)是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 战略动态博弈的困难在于,在前一刻最优的决策在下一刻可能不再为最优,因此在求解上发生很大的困难。 动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。战略是一个完备的行动计划:在博弈开始之前就规定出每一个决策点上的选择,即使这个决策点实际上不会出现。 先动优势与后动优势 在动态博弈中,行动总有先后顺序。有些博弈具有先动优势(first-mover advantage),但有些博弈具有后动优势(second-mover advantage). 产量竞争具有先动优势,而价格竞争可能是后动优势; 开会发言? 在不完全信息下,顺序更重要。但有些博弈既没有先动优势,也没有后动优势,如抓阄。 [1] 目录 1相关条目 2参考文献 相关条目 静态博弈 参考文献 ↑ 1.0 1.1 1.2 张维迎.《博弈与社会》.第四章 动态博弈与承诺.北京大学光华管理学院