概述 少数者博弈(MinorityGame):生活在社会群体中的人们常常会遇到这样的问题,也就是有许多决策人同时面临两种选择,如果决策人的选择是较少人选择的,就将获益;否则肯定会失利。在不考虑道德因素的前提下,决策人如何决策,这就是少数者博弈问题,这一命题是1997年由瑞士华人张翼成提出的。 理论 少数者博弈是一个研究在有限资源下复杂性竞争系统的博弈模型,它源于经济学家阿瑟(W.B.Arthur)提出的“酒吧问题”,并由张翼成以博弈论的形式提出。尽管模型规则相当简单,但它抓住了金融市场这一类系统的基本特征,是研究经济个体之间既相互竞争又相互协作的复杂行为的有效工具[1]。 举例 一个形象的例子是:有A和B两个房间,我们让N(N是个奇数)个人独立选择进入A或B房间。之后每个人按自己选择进入房间,如果A房人数少于B房,那么进入A房的人就赢了。假设你知道了前几次A房的人数(当然,B房的人数是N减去A房的人数),你如何决定下一次去哪个房间才能使你赢的机会最大?实际上,我们在生活中经常面对这样的选择,比如,在岔路口决定走那一条路才不堵车等等。 就是这么简单的行为,但是它们的宏观的结果(例如:一次进入A房的人数)显现的是那么杂乱和随机。这里有个有趣的怪圈,宏观的行为是很多微观行为的组合效应。但是这些微观行为会根据以前的宏观行为变化,因为假设每个个体的行为是与宏观行为有联系的,例如,有的个体用非常简单的规则来决定自己的行为。例如:上一次哪个房间人少,我这次就去哪个房间。但是,有的个体会用一些稍微复杂的规则。例如,如果哪个房间连续两次都是人最多,那么,下一次我就选哪个房间——因为他认为下一次别人不会去,因为它一直人多。这样,他的赢面反而大。但从宏观上看,它就成了一个不可预测的复杂系统。 运用 例如,在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格将上涨,你将获利。 在实际生活中,股民采取什么样的策略是多种多样的,他们完全根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用"少数人博弈"来解释。 "少数人博弈"中还有一个特殊的结论,即:记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。而这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。 "少数人博弈"还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。 在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线等等。最终,不同特点、不同经验司机的路线选择,决定了路线的拥挤程度。 专家指点:"少数人博弈"这个理论的提出,为解决日常生活中的交通拥挤等问题提供了一个新的思路和方法,但并不能找到一个炒股必赢的方法。 [1]
概述森的帕累托自由不可能性定理指出:弱帕累托标准与个人自由主义可能会出现不一致,这一方面说明了帕累托标准是有缺陷的,它只考虑有关状态之间效率方面的差别,而忽视了这些状态所引起的个人效用之间的冲突;另一方面也说明了:进行社会排序,除了考虑一些合理化的条件而外,还需要考虑个人自由等问题,因为,“……,有一些选择是纯粹个人性质的,比如,状态(x)指社会中其他所有的事情为Ω,A先生睡觉时仰卧,状态(y)指社会中其他所有的事情为Ω,A先生睡觉时伏卧。假如A先生偏好y胜于x,而其他许多人的偏好却相反。那么,可以认为,x和y之间的社会选择是纯粹个人的事情,因为A先生是仅有的一个‘真正’涉及到的人,其他的人都只是‘爱管闲事的人’。也可以认为,可以选择一个这样的集体选择规则,在这个纯粹‘个人性质的’选择中,A先生的偏好应当被社会偏好准确地反映出来。”(Sen,1970)正是基于这一点,森强调,人们应该重视研究个人权利等问题对于社会排序的影响。而新福利经济学以及新福利经济学之前的福利经济学研究都自觉不自觉地回避了这些问题。 森(1970)发现,帕累托标准与自由主义是不相容的。帕累托最优是经济学家和其他社会科学家用来衡量社会效率最常用、最普遍、甚至是唯一的指标,它指的是这样一种状态,即大家都好得不能再好,没有一个人可以在不损害他人福利的前提下使自己的福利得以改善,而个人自由原则又是人类不懈的追求,二者都是人们直觉上能够完全接受的标准。但是,森的研究表明,这两个如此诱人的标准却是矛盾的和无法同时成立的。假设条件森的定理是建立在三个基本前提假定之上: 1、无限制区域原理; 2、帕累托原则; 3、最小自由原则,即社会应当赋予至少两个人各自在至少一对社会状态之间有选择权,如果他认为甲比乙好,社会不应干涉而应认同。 用森的话说就是,如果你想趴着睡而不想躺着睡,社会应当认可。但是,森的证明,对于二人以上的社会,不存在同时满足上述三个条件的社会选择函数。因为,帕累托最优与最小自由原则结合在一起,会出现与阿罗不可能性定理所揭示的孔多塞投票悖论类似的循环性结果。具体表述森关于帕累托自由的这一不可能性定理可以准确地表述为:满足下列条件的集体决策规则是不存在的。 1.排序的理性条件:排序具有自反性、相关性,而且偏好关系是不循环的。自反性是指:对于任意一个选择x都有xRx,即任何选择都至少和自身一样好。相关性是指:对于任意两种选择必有xRy或者yRx或者二者兼有。 2.弱帕累托标准:对于任意的选择x和y,如果所有人i都认为xPiy,那么对于社会而言也有xPy。 3.最低限度的自由主义:存在两个非空、不相交的子集L1和L2,对于两组不同的选择(a,b)和(c,d),如果L1中的所有人认为a好于b,则对于社会而言也有a好于b;如果L1中的所有人认为b好于a,则对于社会而言也有b好于a。同样的,如果L2中的所有人认为c好于d,则对于社会而言也有c好于d;如果L2中的所有人认为d好于c,则对于社会而言也有d好于c。即两组人分别对两组选择具有决定性。任何人都有自由做他喜欢做的事,即有一些选择完全是个人的,个人的某些偏好不应该受其他人的影响。 现在有一本书,比如《查特莱夫人的情人》,有两个人A和B,他们对这本书的看法不同。有三种选择:A读这本书(x),B读这本书(y),谁都不读(z)。如果A是一位假正经,他希望最好谁也别读,但是如果一定要有人读的话,那就最好自己读,以免幼稚的B受到坏影响。因此,A的偏好排序是:zPxPy。如果B认为大家应该读这本书,而且A应该首先读,那么,B的偏好排序是:xPyPz。根据自由主义的原则,对于x和z,A应该有选择的自由,A的偏好是决定性的,因此,社会的偏好排序应该是zPx。同样,对于y和z,B的偏好是决定性的,因此,社会的偏好排序应该是yPz。这样,根据传递性,社会应该偏好y胜于x。但是,根据弱帕累托标准,社会对x和y的偏好应该是x胜于y,因为A和B都偏好x胜于y。这样,帕累托标准和自由主义是不相容的。[1] 如何走出森的悖论,缪勒在《公共选择理论》中提出了两种解决方法,一是让帕累托原则在某些情形中遵从自由权利;二是通过帕累托交易。正如缪勒所指出的,上述矩阵类似于博弈论中著名的囚徒困境状态的帕累托劣等结果是由于每个人独立行使他自己的权利而不考虑对别人的损害这类外部性。
简介胜者全得博弈(winner-take-all game),支付策略取决于对于其他竞争者或参与人而言的相对价值而非绝对价值。 特征这类博弈的一般特征是:回报主要或完全集中于那些最优的竞争者。 在社团参与过程中,也许刚开始时有许多参与者,但最后真正获益的只有一个,即最强实力者。如职位竞选,项目申报等。内容胜者全得博弈虽然将报酬严重地集中在获胜者一方,或者叫“赢家通吃”,但是这种胜者全得吸引了无数人的参与,过多的人参与了这种竞争,都想成为赢家,使得这个竞争市场过于拥挤,太多的人在追逐太少的"梦想",而不是把时间精力用在能为自己和社会创造更多财富的事情上,从经济学角度来讲,这无疑是一种浪费,因为这些行为过多将导致经济的无效率。 诠释从经济的效率来讲,所有人都参与“胜者全得”的竞争比没有人参加效率要高,但比市场上各司其职效率要低。这个理论运用到奥运会上,也是可以理解的,即奥运会促进了世界的交流和经济的融合,比没有奥运要显得有效率;但这终究是运动员之间的体育竞技,如果它吸引了全社会的力量来参与胜者全得的竞赛,那么将导致整个经济效率的下降。应用如果在博弈中,收益不是依据绝对价值而是依据相对价值,并且收益主要或者完全集中于博弈中的获胜者,那么此博弈即为胜者全得博弈。在胜者全得博弈中,获得冠军的人一般都拥有极好的天赋,他在竞争中获胜并得到绝大部分收益,而亚军得到的收入将少得多。例如在体育比赛中,一个冠军可能获得50万美元甚至更多的奖金,而亚军可能只获得lo万美元左右的奖金,其余的人收入则更差。但是,由于有高额的奖金在刺激着获胜者,每个人都渴望自己能获得成功,于是,很多人就参与到这场竞争中。有鉴于此。经济学家R·法兰克(RobertFrank)和P·库克(PhilipCook)在研究了他们称之为“胜者全得”的社会后果后指出:当自由市场者主张市场激励导致社会有效的结果时,我们认为胜者全得市场吸引了过多的参与者,从而导致了无效的消费和投资,并且经常使文化堕落……顶级工资的剧增根源于胜者全得市场的逐渐流行。法兰克和库克强调“位置权利控制”的必要性(例如改革法律系统)和消费累进税,以降低因娱乐、体育和商业的巨额报酬而引发的过度竞争所带来的浪费。 [1]
概述收益函数 收益函数是指每个参与人在参与博弈时依据其所属类型和选择的行动可获得的收益。研究收益函数的目的,是选择参与者的最优策略(optimalstrategy),即策略集合中能使其效用最大化的策略。简介收益函数 在商业活动中,一定时期内的收益,就是指商品售出后的收入,记为R.销售某商品的总收入取决于该商品的销售量和价格。因此,收入函数为 R=pq 其中q表示销售量,p表示价格。收益函数的贝叶斯决从经济角度看当日订货量等于日销售量时,商场没有因为多定货或少定货而造成的机会损失,因此获得的收益最大,所以此例理论上的最大利润为EPC=2,720元。但在实际工作中这个值很难得到,除非商场能够根据情况随时调整进货量,因此商场的经营者往往追求的是期望收益的最大值,在此例中当订货量为7时期望收益最大,EMV*和EVP,分别为2,460元和260元。 EVPI的含义为由于情报不准确而造成的商场的赢利损失,这个损失可能是因为销售量小于7件而引发商品报废产生的损失,也可能是因为销售量大于7件使商场未能多盈利而造成的损失。商场若有百分之百准确的情报,则完全可以避免这类损失,因此定义EVPI为完全情报价值。 为了追求更多的利润,决策者总是希望获取一些准确信高的信息,现在随着越来越多的咨询公司、研究中心的出现,为我们获取高质量的信息提供了可能。只要费用小于预期收入,决策者就可以考虑购买由信息公司提供的情报信息。这些信息主要是通过抽样调查或其他途径得到的概率,与凭借经验预测出来的概率不同它们的可靠性更高,这种概率称为后验概率,而前者称为先验概率。一般的用后验概率代替先验概率进行贝叶斯决策,往往可以得到更准确的方案,这种用后验概率代替先验概率再进行贝叶斯决策,就成为后验分析法。需要指出的是有些情况下并非用后验分析法就一定比先验分析好,如果两者选择的方案相同,则意味着后者在增加成本的情况下收益并没有增加,显然此时先验比后验更加有效率。[1]
概述此赛局原本的述叙是,有一个上校被要求找到在N个战场里士兵的最佳分布,其条件为: 每一个战场,分派较多士兵的一方会胜利;双方都不知道对方在每个战场上分派了多少的士兵;赢了较多战场的一方是最后的赢家。例子考虑一个赛局,两个玩家各自以不递减的顺序写下三个正整数,且这三个正整数相加会等于一特定的数S。接着,这两位玩家分别秀出他们的所写,并比较相应的数字。有三个数字中有两个大于对方的人即赢得此一赛局。 对S=6,只可能有三种可能的选择:(2,2,2)、(1,2,3)和(1,1,4)。很容易便可看出: (1,1,4)对(1,2,3)平手 (1,2,3)对(2,2,2)平手 (2,2,2)胜过(1,1,4) 这表示其最佳策略(纳什均衡点)为(2,2,2)。 对更大的S,游戏会渐渐变得更难分析。对S=12,可证明(2,4,6)是最佳策略;但对S>12,则不存在最佳的决定策略。对S=13,以机率各1/3来选定(3,5,5)、(3,3,7)和(1,5,7)才是最佳机率策略。[1]真实例子在最近的一篇论文里,2000年美国总统选举即被模拟成一个上校赛局。这篇论文主张,高尔可以运用策略来赢得选举,但这个策略在事先是不能辨知的。
名称 索洛悖论(Productivity Paradox) 简介 索洛悖论,又称“生产率悖论”。20世纪80年代末,美国学者查斯曼(Strassman)调查了292个企业,结果发现了一个奇怪的现象,这些企业的IT投资和投资回报率(ROI)之间没有明显的关联。1987年获得诺贝尔奖的经济学家罗伯特·索洛(Robert Solow)将这种现象称为“生产率悖论”(productivity paradox):“我们到处都看得见计算机,就是在生产率统计方面却看不见计算机(Computers everywhere except in the productivity statistics.)”。即,虽然企业在IT方面投入了大量的资源,然而从生产率的角度看,收效甚微。此后,又有许多学者相继投入了“生产率悖论”的相关研究,并受到各方面的密切关注。。
简介 投票悖论多数票规则中存在一个明显的投票悖论。这一悖论由法国著名社会学家多孔塞在18世纪80年代发现,所以又称多孔塞悖论。对这一悖论,人们以一个例子加以说明。假定有三个投票者里根、布什、克林顿对ABC三个议案进行表决。假定里根的个人偏好是A>B>C,布什的个人偏好是B>C>A,克林顿的个人偏好是C>A>B。如果在A和B之间进行选择,那么肯定是A获胜;如果在B与C之间选择,则肯定是B获胜;如果在C与A之间选择,则肯定是C获胜。也就是说投票陷于循环之中。需要指出的是投票悖论只在备选方案超过两个时才会出现,在只有一个或两个备选方案时多数票规则可以获得一个均衡的结果,或者说此时多数票规则是一个最优规则。这酒是为什么在社会生活中人们市场运用“少数服从多数”的规则。还要注意的是一旦投票人数较多或备选方案超过3个,出现投票悖论的概率就会增大。当3个人对3个备选方案进行表决时,出现投票循环的概率为5.7%;当27个人对3个备选方案进行表决时,出现投票循环的概率为11.1%;当3个投票人对17个备选方案进行表决时,出现投票循环的概率为46.4%;当19个投票人对17个备选方案进行投票时,出现投票循环的概率为62.6%。 如何消除投票悖论,这里的关键是确立表决程序。早在1785年,多孔塞就提出,解决投票循环的方法之一就是按照预先设计好的程序对各种备选方案进行两两比较,在每一对方案中选择出多数票支持的方案,最终获胜的那个方案被称为“多孔塞获胜者”。还有一种打破循环的程序叫“淘汰程序”,这种程序安排是:如果在若干个方案中进行选择,在每一轮两两比较中都淘汰掉得票最少的方案,获胜的方案再同剩下的方案进行角逐,最后剩下的就是获胜者。这也说明在多数票规则下,操纵投票程序就可以控制表决结果。 起源 孔多塞发现这一悖论是在十八世纪。200多年来,西方国家对于民主政治的研究极其深入,关于投票问题已经形成系统和成熟的理论体系,孔多塞、阿罗、阿马蒂亚·森等都曾在这一领域做出过杰出贡献。这些研究推动了西方民主的不断发展。 投票悖论十八世纪法国思想家孔多赛就提出了著名的“投票悖论”,也称做是“孔多塞悖论”:假设甲乙丙三人,面对ABC三个备选方案,有如图的偏好排序。由于甲乙都认为B好于C,根据少数服从多数原则,社会也应认为B好于C;同样乙丙都认为C好于A,社会也应认为C好于A。所以社会认为B好于A。但是,甲丙都认为A好于B,所以出现矛盾。投票悖论反映了直观上良好的民主机制潜在的不协调。 甲A>B>C乙B>C>A丙C>A>B 在得多数票获胜的规则下,每个人均按照他的偏好来投票。大多数人是偏好x胜于y,同样大多数人也是偏好y胜于z。按照逻辑上的一致性,这种偏好应当是可以传递的(transivity),即大多数人偏好x胜于z。但实际上,大多数人偏好z胜于x。因此,以投票的多数规则来确定社会或集体的选择会产生循环的结果,这就好象一只狗在追自己的尾巴,会没完没了地循环下去。结果,在这些选择方案中,没有一个能够获得多数票而通过,这被称作“投票悖论”(thevotingparadox),它对所有的公共选择问题都是一种固有的难题,所有的公共选择规则都难以避开这种两难境地。 发展 1972年诺贝尔经济学奖的获得者肯尼思·阿罗,在他的《社会选择与个人价值》(1951)中,证明了著名的阿罗不可能性定理,把这个投票悖论形式化了。在该书中,他运用数学工具把孔多塞的观念严格化和一般化了。那 投票悖论么,能不能设计出一个消除循环投票,做出合理决策的投票方案呢?阿罗的结论是:根本不存在一种能保证效率、尊重个人偏好、并且不依赖程序(agenda)的多数规则的投票方案。 阿罗证明,不存在同时满足如下四个基本公理的社会选择函数: 1)个人偏好的无限制性,即对一个社会可能存在的所有状态,任何逻辑上可能的个人偏好都不应当先验地被排除; 2)弱帕累托原则, 3)非相关目标独立性,即关于一对社会目标的社会偏好序不受其它目标偏好序变化的影响; 4),社会偏好的非独裁性。 简单地说,阿罗的不可能定理意味着,在通常情况下,当社会所有成员的偏好为已知时,不可能通过一定的方法从个人偏好次序得出社会偏好次序,不可能通过一定的程序准确地表达社会全体成员的个人偏好或者达到合意的公共决策。投票悖论表明:根本不存在一种能满足阿罗五个假设条件的社会选择原理。解决投票悖论的方法是限制投票偏好,即将多峰偏好改为单峰偏好。 解决 1998年诺贝尔经济学奖获得者阿马蒂亚·森在20世纪70年代提出对“投票悖论”的解决方法。阿马蒂亚·森所提出的解决投票悖论、绕过“阿罗不可能定理”的方法就是改变甲、乙、丙其中一个人的偏好次序,以解决投票悖论的问题。 投票悖论比如将甲的偏好次序从(A>B>C)改变为(A>C>B)新的偏好次序排列: 甲A>B>CA>C>B乙B>C>A丙C>A>B 于是得到三个社会偏好次序——(A>B)(C>B)(C>A),这样就能避开投票悖论,当然它却改变了甲的偏好次序。 阿马蒂亚·森把这个发现加以延伸和拓展,得出了解决投票悖论的三种选择模式: 一、所有人都同意其中一项选择方案并非是最佳;二、所有人都同意其中一项选择方案并非是次佳;三、所有人都同意其中一项选择方案并非是最差。 阿马蒂亚·森表示在上述三种选择模式下,投票悖论不会再出现,取而代之的结果是得大多数票者获胜的规则总是能达到唯一的决定。但是有一个问题是为了追求一致性,改变、忽略、牺牲了个人偏好次序。 应用 在中国,民主发展的进程正在加速,关于民主的学术研究成果也可谓丰硕,但是对于投票问题的研究还比较薄弱。在投票的实践中也存在简单化的倾向,或者采取单一的简单多数原则,或者人为规定领导和普通干部职工的 投票悖论权重等,随意性比较大。目前,在各个国家或不同领域的民主投票中,人们探索和采取了多种不同的程序模式,比如绝对多数程序、相对多数程序、正向淘汰程序、反向淘汰程序、两轮决胜程序、平均分淘汰程序等等。这些程序和模式哪一种更适合人们中国国情,哪一种更有利于党政干部的选拔任用?这些都需要人们认真研究。当前,各级党委和组织部门,党建理论专家和学者应该在投票问题上投入更多的精力,在学习借鉴西方投票理论的同时,紧密联系中国实际,注意研究中国政治体制和社会生态条件下的选民心理、投票规则,尤其要注意运用实证研究和数理分析的方法,使人们的政策措施更加科学合理。可以说,要真正深化干部制度改革,投票问题是不能绕过的坎。 投票悖论可以留待理论家慢慢研究解决,而实践中存在的一些悖论却需要人们尽快加以克服。比如,所谓民主,从字面上理解,就是“人民做主”,但这里的“做主”必须是“做自己的主”,通过投票等形式,选出可以代表自己利益的人表达自己的意愿或代行决策和管理。选出的人或方案与自己的切身利益密切相关,这就决定了选民会保持理智和负责任的态度。然而目前的干部推荐,很多情况下推荐的是与自己毫无关系的职位和人选,在一个县里兴师动众推荐出的干部,可能要到另外一个县任职;某一个处缺少了一名副职,要由与这个处并不相关的其他处室人员通过选票定夺。这种“替别人做主”的民主不仅与民主的基本要义相悖,而且在实践中也已经显露出明显的弊端。再比如,在一个领导班子内部,副职是正职的助手,要向正职负责。然而,按照现行的干部管理规范,一个领导班子的正职并没有任用班子副职的权力,整个班子都经由不同范围的民主推荐和考察,由上级任命。既然副职的提拔使用与正职无关,那么在工作上,副职就缺乏向正职负责的动力和制约,这就给班子内部的团结制造了隐患。同时,也可以发现这里面存在一个明显的悖论,即上级部门任命一个干部作为正职,前提是相信他能够胜任所从事的事业;然而在用人问题上,上级部门却不能给予他充分的信任,必须替他安排好自己的左膀右臂。 总之,关于民主和投票,只能说刚刚起步。有专家研究指出,当前在干部制度改革上,既存在民主不足,也存在民主过度的问题,或许,这才是投票悖论的真正症结。[1]
概述1979年,麦克里蒙(MacCrimmon)和拉森(Larsson)根据阿莱悖论“相同结果效应”,他们又研究了一个“相同比率效应”问题。理论简介模拟阿莱悖论实验,他们在实验中提出了两套新的选择方案,第一套方案C1和C2分别是:方案C1:100%的可能性获得100万法郎;方案C2:80%的可能性获得500万法郎,2%的可能性一无所获。 方案D1和D2分别是: 方案D1:5%的可能性获得100万法郎,95%的可能性一无所获; 方案D2:4%的可能性获得500万法郎,96%的可能性一无所获。 麦克里蒙和拉森注意到在方案C1和C2中,赢钱的概率比为1/0.8,与方案D1和D2的比率0.05/0.04,是相等的,因此他们将这一现象定义为“相同比率效应”。在这种情况下,人们通常选择C1>C2,D2>D1。 [1]