概述 人才后动优势1990 年Lieberman 和Montgomery 指出后动优势主要存在于三个方面: (1)后动者的“免费搭乘”效应:后动者可能会在产品和工艺研究与开发、顾客教育、员工培训、政府审批、基础投资等很多方面比先动者节省大量的投资,却可以从中获益。 (2)先动者锁定了错误的技术或营销战略:由于市场初期,技术和顾客需求的不确定性和“非连续性”(discontinuities)往往导致先动者的错误决策,而后动者可以从先动者的错误中吸取这些教训,不再犯先动者曾经犯过的错误。 (3)在位者惯性:由于沉没成本的存在,组织僵化,企业不愿引进新产品或改进产品,不愿改革,而后动者作为一个追赶者,时刻都想抓住机遇从而取代先动者的地位,因而对企业的组织结构、技术、产品等都进行大量的革新,从而在与先动者的竞争中占有优势。 来源 后动优势汤姆森等人也对后动优势进行了研究分析,他们把后动优势的来源归结为以下四个方面: (1)具有开拓性的先动者地位比后动者地位所要付出的成本和代价要大得多,而且先动者几乎没有获得什么经验曲线效应。 (2)由于技术变革速度很快,早期投资的设备和技术会很快过时,而后动者可以采用最先进的技术和设备。 (3)由于顾客对先动者的忠诚度很弱,后动者很容易就能打开市场。 (4)先动者付出巨大代价获得的技术和经验可能轻易地被模仿甚至超过。 除了上面所说的几个主要观点以外,其他还有很多学者对后动优势作了研究和归纳,但大多数都是围绕以上几个主要的因素。在次序经济理论发展的过程中,有些学者也提出了一些修正因素,这些修正因素对理论的完善起了很大的作用。 Kerin,Varadarajan 和Peterson 在1992 年指出:先动优势的实现还要取决于产品——市场中的权变因素(contingencies),这些权变因素对先动优势因素会产生调节效应(moderating effect),从而直接影响先动优势的大小甚至使先动优势变为先动劣势。这些权变因素包括: (1)影响经济因素的权变因素:需求不确定性和进入规模、有效规模与市场容量之比、广告密度、后动者反应时间、范围经济。 (2)影响先取因素的权变因素:产品的特性、需求不确定性和先占性投资。 (3)影响技术因素的权变因素:技术创新的特征,技术变化和技术的非连续性。 (4)影响行为因素的权变因素:产品的特性、市场类型以及顾客对共有的特殊资产(cospecialized assets)的投资、市场演变。 Jili 等人在2003 年也指出:所谓的先动者优势要视企业的资源而定。倘若不考虑企业资源的差异,就很难准确地考察先动战略的真实影响。同时,控制或考虑外部环境因素和制度因素也很重要。换句话说,就是在研究过程中,必须把非进入次序因素上的差异“剔除掉”,在保持其他因素不变的情况下,考察进入次序对竞争优势的影响。 Lieberman 和Montgomery 在1998 年则正式提出了与资源基础论(Resource-based View)结合起来的研究方法,资源基础论的框架结构有助于市场进入次序方面更复杂更全面的研究设计,从而可获得更真实的进入次序效应(Entry order effect)。 除了以上所列的国外学者对次序经济理论的研究成果以外,还有大量的研究成果在理论的发展中起着推动作用,例如:美国经济学家列维(Levy)在1966年提出的后发优势和后发劣势并存论、阿伯拉莫维茨(Abramovitz)的潜在后发优势论、日本的南亮进的“后进利益”论、伯利兹(Brezis)的技术蛙跳模型以及范艾肯(Van Elkan)的技术—经济趋同论等等。 北京大学国内的次序经济理论研究还处在一个初级阶段,相关的理论和方法都还是国外的一些原型,还没有真正的运用到国内实际问题中去。基于中国经济的快速发展的现实,中国学术界对次序经济理论的研究也迅速升温,国内也有大量的学者已经进行了较为仔细的研究,并得到了一些较为重要的结论,这些都是次序经济理论在国内研究发展的新方向。北京大学的陈遊芳博士研究了后动优势的来源最后归纳为四个: (1)后动企业可以从先驱企业的错误中学习,进而可以获得差别化和成本优势。 (2)后动企业可以通过“搭便车”,来降低产品成本,获得成本优势。 (3)后动企业可以通过创新,改变游戏规则,获得竞争优势。 (4)市场情况发生变化时,后动企业有可能获得优势。 武汉大学的宋岚对先动优势进行了研究,并做了三个方面的分析,分别是: 资源先取优势,成本优势和创造转换成本的优势;四川大学的黄璐研究了动态竞争中的次动者优势,分析了次动者优势日益明显的原因主要是由于企业R&D投入的相继增加、创新风险的日趋加剧、市场开拓成本的不断增加和新旧技术的加速更替;合肥工业大学的黄志斌和朱孝忠从产业经济学的角度研究的市场进入次序优势;武汉理工大学谢科范教授从风险的角度研究了次序经济理论。1993 年罗荣渠归纳了后发优势与后发劣势的表现形式,并论证了他们在现代化发展历程中的重要作用和重要影响。1999 年傅家骥和施培公两人探讨了作为后发优势重要表现的技术模仿创新问题,从资源积累的角度对模仿创新造就后发优势的内在机理进行了探讨。2000 年郭熙保从发展经济学的基本理论出发,深入研究了西方经济追赶理论,对涉及后发优势与后发劣势的各种流派和观点进行了总结和归纳,并对全球化与信息化条件下后发优势与后法劣势的新变化作了有益的探索。 这些研究都代表了国内在次序经济领域研究的最新成果,但是研究还停留在理论的层面上,对于实际问题还没有做具体的实证分析,清华大学吴贵生教授以中国通信设备制造业为例研究了在位者失败和后来者追赶,为以后的研究指明了方向。 理论 后动优势实例进入次序优势研究开始只针对先动优势,后来才逐渐注意到并加强了先动劣势或者说后动优势的研究,因此正面研究的不多,涉及的基础理论总结一下主要有: (1)免费搭乘效应:免费搭乘者指的是得到某种收益却回避了为此支付的消费者或企业。该理论在基础经济学中主要用于公共物品的分析。在本研究领域中,这可以看作是先进入企业投资的一种外溢效应(spillover)。后进入企业可能会在产品和工艺研发、顾客教育、员工培训、政府审批、基础投资等多方面比先进入企业节省大量投资却同样可以受益。这大大削弱了先进入企业的竞争力和利润,也削弱了先进入企业进行早期投资的动力(Lieberman 和Montgomery 1988,1990)。 (2)沉没成本理论:沉没成本是己经发生而无法收回的费用。其“沉没”的主要原因在于资产的专用性。在市场初期,技术和顾客需求的不确定性往往导致先进入企业锁定错误的战略,而后进入企业可以从先进入企业的错误中吸取教训。尤其是非连续性的技术变革(technological discontinuities),会使先进入企业的早期投资很快过时,从而使后进入企业在下一代产品中采用更先进的技术和更有效率的生产工艺获取竞争优势(汤姆森 2000)。 (3)态度转变理论:态度形成后虽然具有相对的一致性,但并不是永恒固定的,它能够被改变。态度转变与态度形成具有同样的重要性。态度改变策略一般有:(1)改变消费者的基本动机函数;(2)将产品与理想的产品组(group)和事件(event)联系起来;(3)化解两种矛盾的态度;(4)改变多属性模型(multi-attribute model)的组成部分;(5)改变消费者对竞争者品牌的看法(Leon and Leslie 2001)。后进入者可以通过改变消费者偏好而不仅仅是应对消费者偏好的策略来克服先动优势,Carpenter 和Nakamoto(1990)己经证明,一个能够娴熟地影响和改变消费者偏好的后进入者能够获得差异化优势。 (4)资源基础理论:资源基础论认为企业所拥有的资源和能力是竞争优势的最终来源。先动优势的持续性依赖于先驱企业拥有的初始资源和以后发展的资源及能力的支撑。如果先驱企业在资源能力的数量和质量方面难以与后来者匹敌,则先动优势很难保持。Chandler(1990)指出,进行大规模生产资源投资的企业,不一定是先驱企业,往往领导市场。因此具有丰富资源和优势能力的企业,特别是具有制造和营销核心能力的大企业,常常后进入市场,但能轻而易举地战胜较小的先进入企业,获得市场主导地位。 (5)组织惯性理论:组织发展到一定程度,或多或少都会产生一些惯性。 一般来说,组织产生时间越长,惯性往往越大。先进入企业往往由于惯性不能适应环境和机遇的变化,依然固守于最初的技术和营销战略。企业组织可能会变得官僚化,企业运作变得程式化,与其他组织的交流关系和分销关系固定化,缺乏技术远见和新思想,不愿改进产品和引进新产品,不愿淘汰旧的生产工艺和技术。 最为严重的是组织盲症,有时先进入企业虽然己经认识到了威胁,也采取了改革行动,但由于组织因素,往往导致改革失败。这些都严重损害了先进入企业的竞争力。(Lieberman 和Montgomery 1990) 除上述五个理论之外,用来解释先动劣势的还有其他一些观点和理论雏形,比如先进入企业定位不正确且重新定位成本很高;或者先进入企业不能适应环境和需求的变化以及应对竞争威胁等,他们也无法维持长期竞争优势(Abell 1978)。这些观点和理论雏形还有待人们进一步的探求和总结。 举例 在“智者博弈”中,小猪的优势策略就是坐等大猪去按按钮,然后从中受益。换句话说,小猪在这个博弈中具有后动优势,大猪按不按钮,小猪的损失都不如大猪的多。大猪不按,双方都没有吃;大猪按按钮,小猪可以多吃。这样的后动优势在历史上也是屡见不鲜的,朱元璋接受谋士朱升的"高筑墙、广积粮、缓称王"的策略就属于一种后发制人的策略,也是“智者博弈”的生动再现。 [1]
目录 1概述 2海盗博弈故事1 3海盗博弈的延伸1 4参考文献 概述 海盗博弈是一个简单的数学博弈。该博弈描述了如果遵循经济人的行为,结果可能让人惊讶。 海盗博弈故事1 有五个非常聪明的理性的海盗,分别编号P1,P2,P3,P4,P5。他们一同抢夺了100个金币,现在需要想办法分配这些金币。 海盗们有严格的等级制度:P1 < P2 < P3 < P4 < P5。 海盗们分配原则是:等级最高的海盗P5提出一种分配方案。然后所有的海盗投票决定是否接受分配,包括提议人。并且在票数相同的情况下,提议人有决定权。如果提议通过,那么海盗们按照提议分配金币。如果没有通过,那么提议人将被扔出船外,然后由下一个最高等级的海盗提出新的分配方案。 海盗们基于三个因素来做决定。首先,要能存活下来。其次,自己的利益最大化(即得到最多的金币)。最后,在所有其他条件相同的情况下,优先选择把别人扔出船外。 现在,假如你是等级最高的P1,你会做何选择?直觉上,为了保住自己的生命,你可能会选择留给自己很少的金币,以便让大家同意自己的决策。然而,这和理论结果相差甚远。 解决这个问题的关键是换个思维方向。与其苦思冥想你要做什么决策,不如先想想最后剩下的人会做什么决策。假设现在只剩下P1和P2了,P2会做什么决策?很明显,他将把100金币留给自己,然后投自己一票。由于在票数相同的情况下提议人有决定权,无论P1同不同意,P2都将实现自己的目的。 现在再把P3加进来。P1知道,如果P3被扔下海,那么游戏又将进行到上面的情况,P1终将一无所有。P3同样看到了这一点,所以他知道,只要他给P1一点点利益,P1就会投票支持他的决策。所以P3最终的决策应该是: P4的策略也类似。由于他需要50%的支持,所以他只需贿赂1个金币给P2就可以了。P2一定会支持他(否则轮到P3做决策,他就一无所有啦)。所以P4最终的决策是: P5的情况稍有不同。由于这次一共有5个人,所以他至少需要贿赂两个海盗以使自己的决议通过。唯一的决策就是: 博弈 有五个理性的海盗,A,B,C,D和E,找到了100个金币,需要想办法分配金币。 海盗们有严格的等级制度:A比B职位高,B比C高,C比D高,D比E高。 海盗世界的分配原则是:等级最高的海盗提出一种分配方案。所有的海盗投票决定是否接受分配,包括提议人。并且在票数相同的情况下,提议人有决定权。如果提议通过,那么海盗们按照提议分配金币。如果没有通过,那么提议人将被扔出船外,然后由下一个最高职位的海盗提出新的分配方案。 海盗们基于三个因素来做决定。首先,要能存活下来。其次,自己得到的利益最大化。最后,在所有其他条件相同的情况下,优先选择把别人扔出船外。 结果 直觉上认为,A海盗会给自己分配很少,以避免被扔出船外。然而这和理论结果相差甚远。 让我们反过来看:如果只剩下D和E,D给自己100个金币,给E0个。因为D有决定权,所以分配达成。 如果剩下三个人(C,D和E),C知道D下轮会给E0个金币,所以C这轮给E1个金币,让E支持自己以使得提议通过。因此如果剩下三个人,结果是C:99,D:0,E:1。 如果B,C,D和E剩下,B知道上述结果。所以为了避免被扔出去,他只需要给D1个金币,因为他有决定权,只需要D的支持就足够了。因此他会提议B:99,C:0,D:1,E:0。有人可能想到提议B:99,C:0,D:0,E:1,因为E知道即使把B扔出去,也不会得到更多了。但由于海盗会优先把别人扔出去,所以E会选择杀死B,然后仍然可以从C的提议中得到相同金币。 假设A知道所有的一切,他就能选择让C和E来支持他,提议变成: A:98金币B:0金币C:1金币D:0金币E:1金币[1]同样的A:98,B:0,C:0,D:1,E:1或者其他的提议都不是最好的,因为D会选择把A扔出去,然后从B那里得到相同的金币。[1] 海盗博弈的延伸1 如果海盗的数目不止5个呢? 继续按照这个逻辑推理,P6的决策将是:…一直到P200,它会给自己留1个金币,同时给剩下所有偶数编号的海盗1个金币。 海盗 P1 P2 P3 P4 P5 … P197 P198 P199 P200 决策者 P1 100 P2 0 100 P3 1 0 99 P4 0 1 0 99 P5 1 0 1 0 98 … … … … … … … P198 0 1 0 1 0 … 0 2 P199 1 0 1 0 1 … 1 0 1 P200 0 1 0 1 0 … 0 1 0 1 如果海盗数是201个,那么P201该怎么做呢?乍一看去,他好像没有足够的钱去贿赂别的海盗了。不过,为了保住自己的性命,他还是可以把自己手中的金币全分出去,即给每个奇数编号的海盗(P_1~P199)一个金币。这样虽然空手而归,但不至于人财两空。 P202也只能把这100个金币全部贿赂给其他100个海盗,这100个海盗必须是在P201做决策的情况下什么也得不到的海盗。由于符合这样条件的海盗有101个(所有偶数编号的海盗P201),P202的决策不再是唯一的了!有101种方案供他选择。 可怜的是P203。由于人数众多,他实在没有足够的钱去贿赂其他海盗以获得足够的支持(他需要至少102个人的支持,包括他自己)。所以,不论P203做什么决策,他都难逃被扔出船外的厄运了。不过P203并没有我们想象中的那么悲情,因为这样的悲剧发生当且仅当船上正好有203个海盗。我们再增加一个海盗,P204。P204明白,P203现在的唯一愿望就是活下来…所以不论P204做什么决策,P203都会举双手支持他(当然举多少手都只能算一票)。所以P204可以靠他自己的一票,P203的一票和贿赂另外100个海盗获得正好50%的支持。 P204可能的决策也只有101种,如下表:(可能获得1金币的海盗用"Y"标示) P1 P2 P3 P4 … P199 P200 P201 P202 P203 P204 P_{204} Y N Y N Y N N Y N N P205就没有那么幸运了。他不能无偿的得到P203和P204的支持。所以如果轮到P205做决策,他也必定被扔到船外。P206也一样,尽管他能得到P205的免费支持,但是这还不够。P207需要得到至少104个海盗的支持,所以有了P205,P206的无偿支持还是不够。 P208就比较幸运了。他也是需要得到104个海盗的支持,但P205,P206,P207,加上他自己,再加上贿赂100个海盗,正好104票。 P_208可能的决策:(这次他有种决策) P1 P2 P3 P4 … P199 P200 P201 P202 P203 P204 P205 P206 P207 P208 P208 N Y N Y N Y Y N Y Y N N N N 从这里我们又看出了新的规律: 从P201之后,在每两个能够作出决策保住自己生命的海盗之间,存在着一些无论如何决策都会被扔到船外的海盗。而这些海盗会支持在这之后的那个能够做出决策保住自己生命的海盗。用数学来表达,设在P201之后,能够作出决策保住自己生命的海盗的编号所组成的序列为an。则有: 对于(2), 若an是偶数,则an = 2a(n − 1) − 200 若an是奇数,则an = 2a(n − 1) − 199 给定一个固定的初值,数列的下一项有两个可能解:一个奇数解、一个偶数解,且偶数解比奇数解小1。再考虑我们原问题的意义,到达偶数解时,偶数编号的海盗已经能够做出决策保全自己。这说明我们应该舍弃所有奇数解。 由an = 2a(n − 1) − 200以及a0 = 202,我们得到通解为:an = 200 + 2n + 1。考虑到P201也能保全自己,我们可以把所有能够保全自己但却得不到金币的海盗的编号写成统一表达式: 不难推出这些海盗可能的决策种数为,其中 Image:海盗博弈.jpg 参考文献 ↑ 1.0 1.1 逻辑与直觉–海盗博弈
【谎言者悖论的内容】西元前6世纪,哲学家克利特人艾皮米尼地斯(Epimenides)说了一句很有名的话:“所有克利特人都说谎。他们中间的一个诗人这么说。”这句话有名是因为它没有答案。因为如果艾皮米尼地斯所言为真,那么克利特人就全都是说谎者,身为克利特人之一的艾皮米尼地斯自然也不例外,于是他所说的这句话应为谎言,但这跟先前假设此言为真相矛盾;又假设此言为假,那么也就是说所有克利特人都不说谎,自己也是克利特人的爱皮米尼地斯就不是在说谎,就是说这句话是真的,但如果这句话是真的,又会产生矛盾。因此这句话是没有解释的。谎言者悖论就是指一个人说:“这句话是假的。”因为无论这句话是真是假都会导出矛盾。 【经典悖论导读】古今中外有不少著名的悖论,它们震撼了逻辑和数学的基础,激发了人们求知和精密的思考,吸引了古往今来许多思想家和爱好者的注意力。解决悖论难题需要创造性的思考,悖论的解决又往往可以给人带来全新的观念。 本文将根据悖论形成的原因,粗略地把它归纳为六种类型,分上、中、下三个部份。这是第一部份: 由概念自指引发的悖论和引进无限带来的悖论 (一)由自指引发的悖论 以下诸例都存在着一个概念自指或自相关的问题:如果从肯定命题入手,就会得到它的否定命题;如果从否定命题入手,就会得到它的肯定命题。1-1谎言者悖论 公元前六世纪,哲学家克利特人艾皮米尼地斯(Epimenides):“所有克利特人都说谎,他们中间的一个诗人这么说。”这就是这个著名悖论的来源。 《圣经》里曾经提到:“有克利特人中的一个本地中先知说:‘克利特人常说谎话,乃是恶兽,又馋又懒’”(《提多书》第一章)。可见这个悖论很出名,但是保罗对于它的逻辑解答并没有兴趣。 人们会问:艾皮米尼地斯有没有说谎?这个悖论最简单的形式是:“我在说1-2“我在说谎” 如果他在说谎,那么“我在说谎”就是一个谎,因此他说的是实话;但是如果这是实话,他又在说谎。矛盾不可避免。它的一个翻版:“这句话是错的。” 1-3“这句话是错的” 这类悖论的一个标准形式是:如果事件A发生,则推导出非A,非A发生则推导出A,这是一个自相矛盾的无限逻辑循环。拓扑学中的单面体是一个形像的表达。哲学家罗素曾经认真地思考过这个悖论,并试图找到解决的办法。他在《我的哲学的发展》第七章《数学原理》里说道:“自亚里士多德以来,无论哪一个学派的逻辑学家,从他们所公认的前提中似乎都可以推出一些矛盾来。这表明有些东西是有毛病的,但是指不出纠正的方法是什么。在1903年的春季,其中一种矛盾的发现把我正在享受的那种逻辑蜜月打断了。” 他说:谎言者悖论最简单地勾画出了他发现的那个矛盾:“那个说谎的人说:‘不论我说什么都是假的’。事实上,这就是他所说的一句话,但是这句话是指他所说的话的总体。只是把这句话包括在那个总体之中的时候才产生一个悖论。”(同上) 罗素试图用命题分层的办法来解决:“第一级命题我们可以说就是不涉及命题总体的那些命题;第二级命题就是涉及第一级命题的总体的那些命题;其余仿此,以至无穷。”但是这一方法并没有取得成效。“1903年和1904年这一整个时期,我差不多完全是致力于这一件事,但是毫不成功。”(同上) 《数学原理》《数学原理》尝试整个纯粹的数学是在纯逻辑的前提下推导出来的,并且使用逻辑术语说明概念,回避自然语言的歧意。但是他在书的序言里称这是:“发表一本包含那么许多未曾解决的争论的书。”可见,从数学基础的逻辑上彻底地解决这个悖论并不容易。 接下来他指出,在一切逻辑的悖论里都有一种“反身的自指”,就是说,“它包含讲那个总体的某种东西,而这种东西又是总体中的一份子。”这一观点比较容易理解,如果这个悖论是克利特以为的什么人说的,悖论就会自动消除。但是在集合论里,问题并不这么简单。 【悖论定义】悖论是指一种导致矛盾的命题。悖论(paradox)来自希腊语“para+dokein”,意思是“多想一想”。 如果承认它是真的,经过一系列正确的推理,却又得出它是假的;如果承认它是假的,经过一系列正确的推理,却又得出它是真的。(zh.wikipedia.org/wiki/悖论)把集合分成两类,凡是不以自身作为元素的集合称为正常集,(例如,自然数集N本身不是一个自然数,因此N是正常集。)凡是以自身作为元素的集合称为异常集。(例如,所有的非生物的集合F并非生物,因此F是异常集。)这样,许多日常中常见的悖论(说谎者悖论,理发师悖论,上帝悖论等)都可以归入异常集之中了。另外一种悖论是关于无限的,虽然我们现在基本上都能接受极限的理论,但是要把这个理论向那些不懂的人解释还是十分困难的。比较经典的有:(古希腊数学家芝诺(Zeno of Elea)的阿基里斯悖论)阿基里斯在赛跑中不可能追上起步稍微领先于他的乌龟,因为当他要到达乌龟出发的那一点,乌龟又向前爬动了。阿基里斯和乌龟的距离可以无限地缩小,但永远追不上乌龟。(古希腊数学家芝诺(Zeno of Elea)的二分法悖论)当一个物体行进一段距离到达D,它必须首先到达距离D的二分之一,然后是四分之一、八分之一、十六分之一、以至可以无穷地划分下去。因此,这个物体永远也到达不了D。“1厘米线段内的点与太平洋面上的点一样多”康托尔(1845-1918)成功地证明了:一条直线上的点能够和一个平面上的点一一对应,也能和空间中的点一一对应。由于无限,1厘米长的线段内的点,与太平洋面上的点,以及整个地球内部的点都“一样多”。 [1]
经济学上的“海盗分金”模型 推理过程是这样的:从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热,就是因为公司里的小人物好收买。1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓!再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何?通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶酪?”可以料想,一旦1号所提方案和其所想的不符,就会有人大闹……当大家都闹起来的时候,1号能拿着97枚金币毫发无损、镇定自若地走出去吗?最大的可能就是,海盗们会要求修改规则,然后重新分配。想一想二战前的希特勒德国吧!而假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金币时,先由2号海盗来分……然后是3号……这颇有点像美国总统选举,轮流主政。说白了,其实是民主形式下的分赃制。最可怕的是其他四人形成一个反1号的大联盟并制定出新规则:四人平分金币,将1号扔进大海……这就是阿Q式的革命理想:高举平均主义的旗帜,将富人扔进死亡深渊……制度规范行为,理性战胜愚昧! 如果假设变为,是10人分100枚金币,投票50%或以上才能通过,否则他将被扔入大海喂鲨鱼,依此类推。50%是问题的关键,海盗可以投自己的票。因此如果剩下两个人,无论什么方案都会被通过,即100,0。往上推一步,3个人时,倒数第三个人知道如果出现两个人的情况,因此它会团结第一个人,给他一个金币“往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。真地是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。 最一般性、可随意更改数据的解释 1、问题的提出 5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。 他们决定这么分: 1 抽签决定自己的号码(1,2,3,4,5) 2 首先,由1号提出分配方案,然后大家5人进行表决,当且仅当半数和超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。 3 如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当半数和超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。 4 以次类推...... 条件: 每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。 问题: 第一个海盗提出怎样的分配方案才能够使自己的收益最大化(如果在规则中加上下面一条会更加完善:海盗在自己的收益最大化的前提下乐意看到其他海盗被扔入大海喂鲨鱼) 讨论 使用倒推法:一、假设1、2、3号已被扔入海中,则4号的方案必为100、0,且必定通过。故5号在得到3号1个宝石的情况下会坚决支持3号的方案。二、3号的方案必为99、0、1,且必定通过。故4号在得到2号1个宝石的情况下会坚决支持2号的方案。三、2号的方案必为99、0、1、0,且必定通过。2号不能把给4号的1个宝石给5号,5号未必坚定地支持2号的方案,因为3号必定通过的方案也能让他得到1个宝石。为了万无一失的保命,2号必须选4号,且必定通过。故3号、5号在各得到1号1个宝石的情况下会坚决支持1号的方案。四、1号的方案必为98、0、1、0、1,且必定通过。故答案是:98,0,1,0,1。 推广 有X(1=<X=<202)个海盗,100颗宝石,其它规则同上。则1号海盗的最大化收益 Y =101-((X+1)/2所得数取整)。 (当X=201及X=202时,1号海盗的最大化收益为0,但可保命。) Z(2=<Z=<X)号海盗的收益:Z为奇数时收益为 1, Z为偶数时收益为 0 。对于X>202时情况,可先在X=500个的情况下进行讨论,然后再作推广。依然是使用倒推法。203号海盗必须获得102张赞成票,但他无法用100个宝石收买到101名同伙的支持。因此,无论203号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。204号海盗必须获得102张赞成票,203号为了能保住性命,就必须让204号的方案通过,避免由203号自己来提出分配方案,所以无论204号海盗提出什么样的方案,都可以得到203号的坚定支持。这样204号海盗就可以保命:他可以得到他自己的1票、203号的1票、以及用100个宝石收买到的100名同伙的赞成票,刚好达到所需的半数支持。能从204号那里获得1个宝石的海盗,必属于按照202号海盗的方案将一无所获的那102名海盗之列。 205号海盗必须获得103张赞成票,但他无法用100个宝石收买到102名同伙的支持。因此,无论205提出什么样的分配方案,他都注定会被扔到海里去喂鱼。206号海盗必须获得103张赞成票,他可以得到205号的坚定支持,但他无法用100个宝石收买到101名同伙的支持。因此,无论206号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。207号海盗必须获得104张赞成票,他可以得到205号和206号的坚定支持,但他无法用100个宝石收买到101名同伙的支持。因此,无论207号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。208号海盗必须获得104张赞成票,他可以得到205号、206号、207号的坚定支持,加上他自己1票以及收买的100票,使他得以保命。从208号那里获得1个宝石的海盗,必属于那些按照204号方案将一无所获的那104名海盗之列。现在可以看出一条新的、此后将一直有效的规律:那些方案能通过的海盗(他们的分配方案全都是把宝石用来收买100名同伙,自己连1个宝石都得不到)相隔的距离越来越远,而在他们之间的海盗则无论提出什么样的方案都会被扔进海里。因此,为了保命,他们必会投票支持排在他们前面的海盗提出的任何分配方案。得以避免葬身鱼腹的海盗包括201、202、204、208、216、232、264、328、456号,即200+1、200+2、200+4、200+8、200+16、200+32、200+64、200+128、200+256。即200+2的0次幂,200+2的1次幂,200+2的2次幂,200+2的3次幂,200+2的4次幂,200+2的5次幂,200+2的6次幂,200+2的7次幂,200+2的8次幂,即其号码等于200加2的某次幂。 发展 著名数学家和经济学家,加利福尼亚州 帕洛阿尔托 的 Stephen M. Omohundro 在1998年对此类问题进行了解答。 本题是该类问题的一个具体题目:微软经典面试题------海盗分宝石,20分钟给出答案即可获得年薪8万美金的职位:5个海盗抢到了100颗宝石,即 X=5,A=100。 此类问题体现出的多方博弈情况下的生存哲学:1、没有永恒的朋友,只有永恒的利益。2、在临界点之下,以决策者的身份出场,冒最大的风险,得到最大的利益。3、在接近临界点的地方,是收益分配最接近公平的地方。半数的人均匀地受益,另半数的人均匀地不受益。4、越过临界点之后,以决策者的身份出场,风险极大,甚至会将老本赔进去,而收益却为零,这是最糟的情况,因为大家的收益都不高。这是一种不稳定的状态,系统会通过自我调整向临界点靠拢。5、永远都不可能发生所有人都有收益的情况,任何时候都有至少 一半或者接近一半 人无收益,除非只有1个人。另外,如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。[1]
简介 根据经济学的基本原理:商品的价格由商品的替代效应和收入效应共同作用结果,替代效应与价格反方向而收入效应与价格同方向。对于正常品来说,替代效应与价格呈反方向的变化,收入效应与价格效应也呈反方向的变化,在它们的共同作用下,总效用必定与价格呈反方向的变动,所以,正常品的需求曲线是向右下倾斜的。对于低档品来说,替代效应与价格效应呈反方向变动,收入效应与价格效应呈同方向变化,而且,在大多数场合,收 吉芬反论入效应的作用小于替代效应的作用,所以,相应的需求曲线是向右下倾斜的。 对于吉芬商品,它是一种特殊的低档品,它的收入效应作用很大,以至于超过了替代效应的作用,从而使总效用与价格呈同方向变化,这是吉芬商品的需求曲线呈现出向右上方倾斜的特殊情况。 所谓吉芬商品,经济学中的一个名词,它是指在其他因素不变的情况下,某种商品的价格如果上升,消费者对其需求量反而增加的商品。2001年以来,中国经济学界就需求定律展开了一场争论,参战学者之多,讨论时间之长,影响范围之广,较为罕见。至今,这场争端并无结果,对于广大读者或经济学界人士而言,还是一头雾水:需求曲线是否必定向右下角倾斜?世界上到底有没有“吉芬商品”?张五常等先生坚持认为,需求曲线必定向下,现实世界不存在“吉芬商品”。黄有光、汪丁丁等先生则认为存在向上倾斜的需求曲线,认为存在“吉芬商品”。 而更多的学者专家则认为吉芬商品是作为一个经济学的需求定理的例外现象!可是我个人更倾向于张五常先生的意见。从教科书上看,需求定律指的是,在其他条件不变时,需求价格与需求量呈反向变动关系。用坐标图表示,如果用横坐标表示需求量,纵坐标表示价格,那么需求定律就可以表示成一条从左上角到右下角的曲线,就是“向右下倾斜”。 吉芬之谜 一种商品价格上升,该商品需求量减少在经济学中,需求定理是指在其他条件相同时,一种商品价格上升,该商品需求量减少。这是绝大多数人所共知的道理,也符合理性人行事的假定。但是,1845年在爱尔兰大饥荒时期,出现了一件奇怪的事,马铃薯价格在上升,但需求量也在持续增加。英国经济学家吉芬(giffen)观察到了这种与需求定理不一致的现象,这种现象也就被经济学界称为“吉芬之谜”,而具有这种特点的商品被称为吉芬商品。 “吉芬之谜”其后已经被经济学家解开,而被看作是需求定理的一种例外。需求定理后面还掩盖着消费者对商品需求的差异。在经济学中,当一种商品的价格发生变化时,会对消费者产生两种影响,一种是使消费者的实际收入水平发生变化,第二种则是使商品的相对价格发生变化,这两种变化都会改变消费者对某一种商品的需求量。 对于所有商品来说,替代效应都是与价格成反方向变动的,而且在大多数情况下收入效应的作用小于替代效应的作用,需求定理一直有效。但是,在少数特定情况下,某些低档商品的收入效应作用要大于替代效应的作用,正是如此,经济学中将商品分为正常商品和低档商品两大类,正常商品的需求量与消费者的收入水平成同方向变动;而低档商品则反之。这在现实生活中也不难理解。试想一下,爱尔兰1845年饥荒使得大量的家庭因此陷入贫困,土豆这样的仅能维持生活和生命的低档品,无疑会在大多数贫困家庭的消费支出中占一个较大比重,土豆价格的上升更会导致贫困家庭实际收入水平大幅度下降。在这种情况下,变得更穷的人们为了生存下来,就不得不大量地增加对低档商品的购买而放弃正常商品,相比起土豆这种低档商品来说,已经没有比这更便宜的替代品了,这样发生在土豆需求上的收入效应作用大于替代作用,从而造成土豆的需求量随着土豆价格的上升而增加的特殊现象。一种商品只有同时具备“是低档品”和“收入效应大于替代效应”这两个条件时,才可以被称之为吉芬商品。 相关事例 吉芬反论经济学教科书上,有一个所谓“吉芬反论”:在讲座需求定律时,英国一位名叫吉芬的爵士向经济学家马歇尔提出如下的一个反论例子,面包是一种主要的粮食,如果面包的价格大幅下降,消费者的购买力增加,多吃了肉类,因而少吃了面包。面包之价下降,但需求量却减少了。这一例子中的面包被称为“吉芬物品”,仿佛它推翻了“需求定律”。 案例:老师带一群小学生旅游登山,每人发给10元人民币要求各人自己购买两听饮料用于山上解渴。现山下小卖部只有两种饮料:一是矿泉水4元一瓶,一是可乐7元一瓶,学生的购买行为既要满足两瓶饮料,又要符合不起出10元钱的“价值取向”,当然只能购买两瓶矿泉水。假如矿泉水现在降价到3元一瓶,可乐仍是7元一瓶,那有的学生就会矿泉水和可乐各买一瓶,于是矿泉水降价,需求量反而减少。这里的矿泉水就成了“吉芬物品”,但不能以为这就推翻了“需求定律”,因为“需求定律”是在市场竞争的条件下才能发挥作用,而案例中的条件完全束缚了竞争,使得“需求定律”无用武之地。 所谓“吉芬物品”实际上是满足人们基本生存需求的最低档次的物品,“吉芬物品”降价,导致消费者的购买力增加;消费者的购买力增加,导致“吉芬物品”的边际效用大幅下降,也就是低档商品价格的替代效应不足以抵消人们需求水平的变化,需求效应大于替代效应,使得降价了的“吉芬物品”的市价还是大于它的实际平均价值,所以减少了需求量。在一般情况下,商品的价值变动必然影响其价格,但商品价格的波动并不影响到它的价值,也就是不会影响到该商品对于人们的边际效用。比如感冒药品的价格波动一般不会影响到该药品的疗效及其在人们心中的地位。可是,在特定的局限条件下出现“吉芬物品”。其表现是随着“吉芬物品”的价相升降,使得其价值发生变化,因而整条需求曲线发生变动。 案例:文革期间的一九六七至一九六九年,农村粮食紧张,红薯和大米是人们村里的主要食品,农民的“自留地”交了公,全靠生产队分配的红薯和大米为生。村里粮食定量,每人一年300斤谷子。但交公粮后实际上没有那么多谷子可分,而且300斤稻谷只能出210斤大米,远远不足一个农民一年的需求。于是生产队就以1斤谷子折算10斤红薯,由农民自己选择。一般每户要一半谷子一半红薯,家家挖地窖储存红薯。有一年,粮食减产,改为1斤谷子折算8斤红薯,即红薯交换价上涨,谷子交换价下跌,农民反而要更多的红薯,减少了谷子需求量。为什么会出现这种红薯价涨需求量上涨,谷子价跌需求量下跌的现象呢?这种情况与“学生登山”的案例相似,是以交换不完备,竞争不充分为条件。红薯价涨,谷子价跌,农民总收入减少(减产),固此重新调整了谷子和红薯的边际效用,改变了二者价值之比。也就是说,在红薯的市价(这里表现为对谷子劲交换价)上涨,谷子的市价(这里表现为对红薯的交换价)下跌的情况下,由于只有两种物品参与竞争,使得红薯西边际效用(价值)大升,谷子的边际效用(价值)大跌,也就是使得红薯的平均价值反而大于上涨了的市价;使得谷子的平均价值反而小于下降了的市价。农民不多要红薯便无法维持一年的最低生活。可见,在这一特定的条件下,价格变动使得需求曲线移动,而不是一般情况下曲线上的点的滑动。 “吉芬反论”的模式大致如下:由于竞争条件的限制,满足人们生存需求的最低档次的物品,其价值有可能按以下规律波动:“吉芬物品”涨价——消费者购买力下降——“吉芬物品”的边际效用增加——消费者只有增加“吉芬物品”的需求量才能维持基本生存条件。这一过程的结果,实际是表现为“吉芬物品”的平均价值大于市场价格。“吉芬物品”降价——消费者购买力上升——“吉芬物品”的边际效用骤减——消费者可以通过减少“吉芬物品”的需求量来改善生活。这一过程的结果,实际是表现为“吉芬物品”的平均价值小于市场价格。这一切是在竞争受限制的条件下产生的。事实上只要交换条件允许,竞争稍许充分,所谓“吉芬物品”就不可能存在。 上述案例,如果还增加一种食品参与竞争,比如土豆。一斤谷子也折算10斤土豆,价格变动前,一般每户要一半谷子,另一半是土豆和红薯各一定比例。红薯价格上涨后,如果土豆价格不变,那农民一定弃红薯而多要土豆,红薯就会因价涨而需求量减少,土豆就会因与红薯的比价下降而需求量增多。因此,只要交换条件允许,竞争充分,所谓“吉芬物品”就不会出现。[1]
定义 最大最小策略是指局中人使得能够获得的最小收益最大化的策略。 实验者自己可以为竞争者指定决定策略,为竞争者制定了4种不同的策略,即最大化、折扣(非线性策略,短期利益不成比例的被估价)、最大最小捕获量(最大化最小收获,始终是一个可以支撑的策略)以及针锋相对策略(做其他参与者先前所做的)。需要强调说明的是,优势策略均衡与纳什均衡的概念是建立在博弈者理性行为的基础上的。每一个博弈者的策略选择不仅依赖于自己的理性行为,也依赖于对手的理性行为。即,不仅每个博弈者自己是理性的,而且每个博弈者知道对手是理性的,每个博弈者知道对手知道自己是理性的,每个博弈者知道对手知道自己知道对手是理性的,……等等。 正是因为要达到优势策略均衡或纳什均衡是需要绝对理性的。任何出现了一点错误将可能使博弈者蒙受巨大的损失,因而可能有player会采取比较保守的策略。 其中一种保守的策略是最大最小策略(Maximinstrategy)。 最大最小策略是什么呢?它是指博弈者所采取的策略是使自己能够获得的最小收入最大化。所谓最小收入是指采取某种策略所能获得的最小收入。 最大最小策略是一种保守的策略而不是利润最大化的策略。 很显然,博弈者往往是在信息不完全的情况下才采取最大最小策略。在信息完全的情形下,他肯定是会采取促使他利润最大化的策略。 在某些情况下,最大最小策略所达到的均衡也是一种纳什均衡。 [1] 思想来源 最大最小决策规则的一个重要思想来源是20世纪著名数学家冯诺伊曼关于二人零和博弈的定理,其中每个人都选择能够最大化自己的最小的可能支付(相应于对手的各个策略)的策略。应用在实际生活中,往往还会遇到非常糟糕的情况,如何选择,做到最大化可能遭遇到的最小的利益,也是伤透脑筋的事情。有时个体的理智不一定会带来理想的结局,甚至可能是最坏的结果。 例如,其中的囚徒困境(PrisonersDilemma)值得我们深思。用表1来解释。从表中可知,对两囚徒而言最好的结果应该是都不坦白,入狱年数是最短的,可这里双方都存在一个非常稳定的占优策略――坦白,因为坦白可以避免自己陷入最糟糕境地,不论对方采取何态度自己坦白都是最好的,但结果却对于双方来说都及其糟糕。其实,这就是一种最大最小策略。这种情况下,个人理性与团队理性显然存在激烈的冲突。 表1:囚徒困境囚徒乙 坦白不坦白 囚徒甲坦白-6,-60,-10 不坦白-10,0-1,-1 表2:寡头合作的不稳定性厂商乙 合作不合作 厂商甲合作200,200120,240 不合作240,120160,160 囚徒困境同样适于分析寡头垄断厂商合作的不稳定性。见表2。分析表中数据,整体而言最理性的做法是(合作,合作)。于是,诸如OPEC等组织会联手以期达到利润最大化。但同时,另外有种激励,若自己悄悄毁约、不遵守协议自己的获利会高于合作下的获利。于是(不合作,不合作)的策略组合排挤掉了(合作,合作)的策略组合,并且由于(不合作,不合作)组合还是一个占优策略均衡,所以,卡特尔经常以失败告终也就属情理之中了。支配性策略 在有些情况下,为了避免陷入被动,采取最大最小策略十分必要。在下图的博弈中,乙方采取“右”是一个支配性策略。因为不管甲方选什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情况下,甲方应该采取“下”,并得到2的收益。这样,支配性策略均衡为(下,右)。如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能故意捉弄甲方,则应该采取最大最小策略,
最近10多年里,不像对策论的传统分析方法那样——考虑有限理性的经济行为人以及在严格的认知局限之下必须学 进化对策论习执行策略,这样的对策论理论及其应用有了迅速的发展。这方面的大量研究工作是在称为进化对策论所提供的框架下进行的。正如此学科标题所表示的,这一新学科的原理借用生物学中的进化模型所具有的与众不同的一些特征。然而,此学科本身也发展了一些新的方法和技术,特别地适合于有限理性基本假设下对社会和经济体制方面的分析。进化对策论在10多年里以快速的步伐取得长足的发展。 定义 进化对策沦为人们提供一种具有广泛适用性的工具。其潜在的应用领域从进化生物学延伸到一般的社会科学,特别是经济学中。进化理论在经济学中有着悠久的历史传统。直到最近,这种方法在非合作对策论框架中才得到应用。 进化对策论是研究策略行为的稳健性,它是针对有限理性行为人所组成的大群体中多次博弈背景下的进化力量而言的。这种新的组成部分在经济理论里导致一种新的预测方法,并且为其他社会科学开辟一条崭新的研究途径。 基本内容 (一)进化稳定策略概念 进化对策论理论中,一个关键概念是进化稳定策略(ESS),这一概念的提出归功于约翰·梅纳德·史密斯(John Maynard Smith)和普莱斯在1973年的“动物冲突的逻辑”一文。此种策略在特定的意义上对进化压力而言是稳健的:群体执行该种策略对执行任何其他策略而言是非入侵的。假定一对个体是重复随机地来自于大的群体,去参与一个对称并有限的两人博弈,还假定所有的个体在博弈中起初都执行某一个纯的或混合的策略x是进化稳定的,那么对于每一个 进化对策论变异策略y,都存在一个正的“入侵障碍”,使得执行变异策略y的个体群体所获得的支付低于此障碍,从而x赢得的预期支付比执行的y所得要高。下面的不等式对于充分小的成立,即: u[x,(1-)x+y]>u[y,(1-)x+y]…………(1) 其中左边的表达式记为对于策略x而言,当执行相对应策略的个体进入之后,混合群体情况的混合策略(1-ε)x+εy时的预期支付,而右边的表达式记为对于策略y而言,其所对应的情况的预期支付。 注意到,进化稳定性准则没有解释种群是如何达到这种策略的。然而,一旦达到这种策略,则这样的策略对进化压力来说是稳健的。同时,人们发现,进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而,它隐含地把变异当成稀少事件,以致于种群有时间在另一个变异出现之前响应这种状况。 虽然,进化稳定性准则是一个生物学上的概念,但是它为各种各样的人类行为提供一种有关的稳健性准则。这样,进化稳定性要求人类群体中企图采用可选择的策略的任何一个小团体不比已经采用“固有”策略的那些个体所构成的团体收益好。相反,采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是,那些采用可选策略的小团体却受激励而具有转变固有策略的行为。在这种社会背景下,进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则。比如,社会风气、企业管理模式等都可以看为是某种人类群体的规则,而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然,在这种背景下,如果那些极少数的人群或企业的收益比不变异的人群或企业高时,那么这些变异分子会生存得更好!反之,则被淘汰掉。 可惜的是,许多博弈没有进化稳定策略。于是,研究人员探讨各种比进化稳定性稍弱一些的形式,以及集值形式的进化稳定性概念等。此外,ESS概念不能推广到n人对策的情况上。在本质上,ESS要求强的纳什均衡来实施,也就是每一个策略对于策略组而言应是唯一的最佳反应。 (二)复制动力学 复制动力学是选择过程的显性模型,它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学的数学公式是由 Taylor和Jonker于1978年在“进化稳定策略和对策动力学”一文中提出的。他们认为由随机配对的个体所构成的一个大种群执行有限对策的两人博弈,犹如进化稳定性的设置一样。然而,此处的个体仅仅采用纯策略。种群状态是指在纯策略上的一个分布x。这种状态在数学上与博弈中的混合策略是等价的。 如果博弈中的收益表示成生物学上的适合性,也就是后代的数目,同时每一个后代继续其父母的策略,因此,采用纯策略i的个体数目(在大的种群中)将以某一比率指数增长,而此等于对纯策略i的预期收益u(ei,x),当执行着表示种群中当前策略分布的混合策略x时,采用任何纯策略i的种群分布的增长率等于此策略的收益与种群中平均收益的差。后者,等同于混合策略x当与其自身博弈时的预期收益u(x,x)。这是一个单种群的对称两人博弈的复制动力学。 Xi=[u(ei,x)-u(x,x)]xi………………(2) 注意到,对当前种群状态x的最佳反应具有最高的增长率。第二最佳反应具有第二高的增长率,如此等等。然而,虽然更成功的纯策略比欠成功的纯策略增长得快,但是种群中的平均收益不必随时间而增长。产生这一原因的可能性是,如果一个个体由采用最佳策略的个体所代替,那么遇见这个新个体的成员会得到比较低的收益。例如,这正是囚徒困境博弈的情况。如果最初几乎所有个体采用“合作”,那么个体中将逐渐地转向“抵赖”,从而平均收益将下降。然而,如果博弈在两个人总是获得相等的收益意义上是一个双对称的,那么自然选择的基本规律将成立:种群中收益随时间而增长,即使没有必要成为全局最大的。例如,这就是合作博弈的情况,其中所有个体逐渐地转向到执行同一个纯策略上。复制动力学能够推广到n人博弈的情况上,这可以看成是来自于 n种群、中的个体随机地以n类型配对,其中每一个参与者的地位状况正如纳什所给出的群体行为解释的那样。目前,存在两种形式的n种群复制动力学,其中一个是由Taylor在 1979年提出的,另一个是由Maynard Smith在1982年给出的。 (三)学习模型 人们把学习模型分成三种类型,即基于信念的学习、强化学习以及模仿学习。最近的一些研究表明,复制动力学 进化对策论是由后面两类的某种模型所促成的。 1.强化学习模型 Bush和Mosteller的强化学习模型及其他的推广形式,已经在一系列的人类主观执行博弈中得到运用。可惜,这些模型的通常数学性质,人们还知道得很少。然而,Borgers和Sarin在1997年发表的“通过强化和复制动力学的学习”文章把Cross的Bush—Mosteller学习模型的形式与Taylor的两种群复制动力学进行了理论上的对比研究。虽然这种学习过程在离散时间背景中是随机的、演化的,而复制动力学在连续时间背景中是确定的、演化的。他们证明,在适当地构造连续时间的界限下,他们的学习过程在有限时间区间内可通过复制动力学来说明。 2.模仿学习模型 博弈论学者Gale,Binmore和Samuelon在1995年提出一个所有个体参与者都采用纯策略的大群体,但是有限博弈的社会学习的简单模型。每一个参与者在博弈中都赢得一个渴望水平的收益。在离散时间0,δ,2δ,…上,任意从群体中抽取个体δ部分,把其当前收益与他们的渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来说明。 在经济学中的应用 进化对策论的产生、发展在本质上就是起因于对策论中关于理性行为人的假设与经济应用中行为人“试验——失 进化对策论误”(即试错法)学习过程相偏离的事实而引发的。从上述的阐述中,我们可以看到,进化对策论在经济学里的应用前景是十分广阔的和吸引人的。 最近,Routledge探讨了金融市场上个体行为人是如何通过适应性或者进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过对来自于模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Routledge运用Grossman和Stiglitz的1980年发表的经济模型的形式。Grossman和Stiglitz模型(GS模型)提供了考察适应学习过程的一种良好的框架,因为它是获得内生信息的标准模型,这点已经被后来的其他许多关于学习方面的模型都是基于GS而提出的事实所证明。 如果假设交易者能够观察到他们自己的适应度和其他行为人的行为,那么模仿是如何发生的许多特殊细节就显得不重要了。Routledge的研究结果表明:首先,作为单调选择动力学的适应学习会促成GS均衡;其次,由单凋适应学习驱使的模仿的稳健性可从随机实验中来获得噪声来研究。他发现,适应学习是缺少稳健性的。特别,他运用Binmore和Samuelson的技术来对模仿和经验建模。为了使带有漂移的适应学习产生GS理性预期均衡,必要的条件是在风险资产供给中的噪声与学习过程中的经验水平有很大的关系。
概述 节约悖论(Paradox of thrift) “节约悖论”是凯恩斯最早提出的一种理论,也称为“节俭悖论”、“节约反论”、“节约的矛盾”根据凯恩斯主义的国民收入决定理论,消费的变动会引起国民收入同方向变动,储蓄的变动会引起国民收入反方向变动。但根据储蓄变动引起国民收入反方向变动的理论,增加储蓄会减少国民收入,使经济衰退,是恶的;而减少储蓄会增加国民收入,使经济繁荣,是好的,这种矛盾被称为"节约悖论"。节约的悖论是根据凯恩斯主义的国民收入决定理论推导出来的结论,它在资源没有得到充分利用的情况下是存在的,是短期的。长期中或当资源得到充分利用时在,节约的悖论是不存在的。 核心理论 凯恩斯的国民收入决定分析,是在非自愿失业存在的前提下进行的短期、静态分析。另外,还要注意到 节约悖论凯恩斯的分析是一种总量分析,没有具体分析消费结构与收入结构。 1936年凯恩斯在《就业、利息和货币通论》中提出了著名的节约悖论,他引用了一则古老的寓言:有一窝蜜蜂原本十分繁荣兴隆,每只蜜蜂都整天大吃大喝。后来一个哲人教导它们说,不能如此挥霍浪费,应该厉行节约。蜜蜂们听了哲人的话,觉得很有道理,于是迅速贯彻落实,个个争当节约模范。但结果出乎预料,整个蜂群从此迅速衰败下去,一蹶不振了。 经济大萧条时期的景象就是节约悖论的一个生动而可叹的例子。由于人们对未来预期不抱任何希望,所以大家都尽量多储蓄。但是,他们不愿意消费的心理和行为又导致其收入继续下降。 数字推理 其国民收入均衡的条件是I=S,即投资=储蓄。 其中 S=Y-C,即储蓄=国民收入—消费 而消费则被假定为一线性函数:C=C。+cY,其中C。为不受收入影响的自发消费,c为边际消费倾向,即增加的消费占增加的收入的比重。由于假定边际消费倾向不变,c同时也为平均消费倾向,即消费占收入的比重。 于是有:S=-C。+(1-c)Y 又假定投资固定不变,即:I=I。 于是得两部门经济国民收入决定方程: I。=-C。+(1-c)Y 解之得: 均衡的国民收入Y*=(C。+I。)/(1-c) 在这一式子中,c作为边际消费倾向,是一个小于1的数,当c变大时,1/(1-c)的值变大,国民收入Y*增加;当c变小时,1/(1-c)值变小,国民收入Y*变小。这意味着,当国民增加消费在收入中的比例时,将会导致更多的国民收入,使整个经济呈现繁荣局面;而当国民降低消费在收入中的比例时,则会引起国民收入下降,使整个经济陷入衰退。简而言之,就是:挥霍导致繁荣,节约导致萧条,这就是本文开头提到的“节约的悖论”。 “节约的悖论”提出来以后,常常使人迷惑不解。根据一般人的常识,一个家庭也好,或一个企业也好,或一个国家也好,如果大家都挥霍浪费,很快就会吃光喝光,破产衰亡。唐代著名文学家韩愈有两句诗说得好:历览前贤家与国,成由勤俭败由奢。 理论解释要理解这个问题,关键是要注意到:凯恩斯的国民收入决定分析,是在非自愿失业存在的前提下进行的短期、静态分析。通俗地讲,就是经济陷入了严重的萧条状态,市场上有大量产品积压在仓库中,找不到销路,也就不能计入国民收入统计数字中。显然,如果国民增加消费,积压的产品就能实现其市场价值,从而使统计到的国民收入数字增加;反之,如果国民减少消费,积压产品增加,统计到的国民收入数字就会下降。这就是凯恩斯国民收入决定分析的实际意义所在,说穿了,凯恩斯提出“节约悖论” 实际上不过是推销积压产品罢了。 但现实经济并非保持静态不变,而是一个动态过程。从长期、动态的角度来看,人们会将节约下来的钱,用于投资,以增加生产能力,从而使经济趋向更加繁荣。相反,若只图眼前繁荣,大肆挥霍浪费,则会影响未来经济发展,甚至导致经济停滞和崩溃。正是在这个意义上,一般人们强调节约,反对奢侈浪费。 在这里,需要提醒读者注意:千万不要将动态分析与静态分析混为一谈。一般地,静态分析的结论常常与动态分析的结论不一致,甚至截然相反。如静态地来看,当一种商品价格下降时,该商品需求量会增加,但是动态地来看,则有“买涨不买跌”之说,即当一种商品价格动态地随着时间下降时,消费者将持币待购,从而导致市场需求量下降。 再如西方经济学中著名的“消费函数之谜”实际上也是混淆了静态分析与动态分析的结果。静态地来看,一个人收入越高,其用于消费的比例越低,但动态地来看,在人们收入随着时间增加的同时,人们的消费需求也在随着时间的推移逐渐发展,结果消费在收入占的比例并不下降。所以,当库兹涅茨试图用动态统计资料来验证凯恩斯的边际消费倾向递减定理时,就会弄得混乱不堪了。 另外,还要注意到凯恩斯的分析是一种总量分析,没有具体分析消费结构与收入结构。在凯恩斯看来,只要增加消费在收入中的比例,就能增加国民收入。其实不然。 抽象地来讲,个人收入的一部分会用于消费,另一部分则用于储蓄,而储蓄则会通过金融机构转到厂商手里,用于增加投资。这样厂商生产的产品就会全部销售出去,其中一部分被消费者购买用于消费,另一部分被其它厂商购买用于投资,整个国民收入就实现了充分就业的均衡。 但实际上,厂商生产的产品并不会完全销售出去,原因在于产品结构与需求结构不一致。例如,中国在2000年前后,市场上积压了大量彩色电视机,尽管彩电价格一降再降,但市场反应却十分冷淡。为什么呢?因为消费者家庭已经普遍购买了彩电,整个彩电市场已经饱和。消费者手里尽管有钱,但并不会用于购买彩电。于是进一步影响到彩电厂商也不会进一步增加彩电生产投资。这样,就导致了市场疲软。在这种情况下,单纯地刺激消费或刺激投资,必然徒劳无功。 那么怎么办呢?唯一的出路只能是调整产品结构,使之与需求结构相一致。更明确地讲,必须开发新兴替代产品,使之与消费者潜在的市场需求结构相一致。例如,在模拟信号彩电市场饱和的情况下,应该开发数字化的液晶彩电或等电离子彩电,这样消费者手里的钱就会转化为现实的购买力,从而使市场走出萧条的困境,逐渐复苏起来,进入新一轮的繁荣佳境。而要开发新兴替代产品,必须有大量投资支持,从而必须有大量居民储蓄。从这个角度来讲,节俭非但不会导致经济萧条,反而会促进经济增长,因而它依然是一 种值得提倡的美德。 解决措施在学习凯恩斯“节约悖论”时,必须明确凯恩斯观点的前提,弄清凯恩斯使用的分析方法,搞清凯恩斯观点的实质内涵。绝不能不问前提不问条件,随处套用。特别是中国作为一个发展中国家,刚刚进入小康阶段,整个国家经济实力还相当薄弱,更不能依据凯恩斯观点,大肆鼓吹刺激消费。让我们跳出凯恩斯短期、静态、总量分析思维的框框,着眼现实经济生活,换用长期、动态、结构分析的思路,为明天的经济发展着想,继续保持和发扬节约的美德吧。只要节约下来的钱,用于投资,用于开发适应消费需求的新兴产品,我们的生活就会变得越来越美好。[1] 当年有人劝告凯恩斯从长远考虑问题时,凯恩斯曾很不耐烦地说:“从长远的观点来看,我们都死了。”凯恩斯已经死了,他可以不管明天,但我们还活着,我们绝不能不管明天。应该指出,这是因为在收入不成问题的基本理论前提下的现代社会,是消费制约生产,而不是生产限制消费。如果不消费或者降低消费就会使资本的运动停滞,随后又会引起对劳动力需求的停滞,最终导致生产的停滞。