概述 有限次重复博弈是指相同结构的博弈有限次重复进行。在有限次重复博弈中,参与者会欺骗和违约,但当参与者不知道哪一次是末期时,决策近于无限次博弈。 如果是有限期的重复博弈,情况就有所不同了。用逆推法来分析博弈过程,可以表明,参与者若明确合作到了最后一期,以后不会再有重复博弈,那么,最后一期的博弈和一次性的博弈就没有区别,参与者的欺骗和违约行为是不可能被报复的,于是最后一期单个参与者的占优策略就是不合作的欺骗或违约。逆推到前一期,每个参与者都推知以后将不合作,所以也不会合作。如此等等,在有限次重复博弈中,囚犯困境博弈的纳什均衡是参与者的不合作。 举例例:一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?”,男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。” 有限次重复博弈与无限次重复博弈的区别无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。 无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。 [1]无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。 目录 1 相关条目 相关条目 无限次重复博弈
目录 1 什么是亚拉巴马悖论 2 亚拉巴马悖论的实例说明 什么是亚拉巴马悖论 选票分配的基本原则是公平合理,要做到公平合理。一个简单的办法是,选票按人数比例分配。但是会出现这样的问题:人数的比例常常不是整数。一个简单的办法是四舍五入,可四舍五入的结果可能会出现名额多余,或名额不足的情况。因为有这个缺点,美国乔治·华盛顿时代的财政部长亚历山大·汉密尔顿在1790年提出一个解决名额分配的办法,并于1792年为美国国会所通过。 美国国会的议员是按州分配。假定美国的人口数是p,各州的人口数分别是p1,p2,Λ,pl。再假定议员的总数是n,记: 称它为第i个州分配的份额.汉密尔顿方法的具体操作如下: (1) 取各州份额qi的整数部分qi,让第i个州先拥有qi个议员。 (2) 然后考虑各个qi的小数部分{qi},按从大到小的顺序将余下的名额分配给相应的州,直到名额分配完为止。 汉密尔顿方法看起来十分合理,但是仍存在问题。按照常规,假定各州的人口比例不变,议员名额的总数由于某种原因而增加的话,那么各州的议员名额数或者不变,或者增加,至少不应该减少,可是汉密尔顿方法却不能满足这一常规。1880年,亚拉巴马州曾面临这种状况,人们把汉密尔顿方法产生的这一矛盾叫作亚拉巴马悖论。 这个问题从诞生之日起,就一直吸引着众多政治家和数学家去研究。这里要特别提出的是,1952年数学家阿罗证明了一个令人吃惊的定理——阿罗不可能定理,即不可能找到一个公平合理的选举系统。这就是说,只有相对合理,没有绝对合理。原来世上本无“公”!阿罗不可能定理是数学应用于社会科学的一个里程碑。 亚拉巴马悖论的实例说明 假定某学院有三个系,总人数是200人,学生会需要选举20名委员,表1是按汉密尔顿方法进行分配的结果。 表1: 系别人数所占份额应分配名额最终分配名额 甲10351.510.310 乙6331.56.36 丙34173.44 合计2001002020 由于考虑到20个委员在表决提案时会出现10:10的结局,所以学生会决定增加1名委员。按照汉密尔顿方法分配名额得到表2。 表2: 系别人数所占份额应分配名额最终分配名额 甲10351.510.81511 乙6331.56.6157 丙34173.5703 合计2001002121 表2的例子指出,委员的名额增多了,但丙系反而减少一名,令丙系不能接受!
目录 1什么是用餐者困境 2形式定义和平衡分析 3实验性证明 4参考文献 什么是用餐者困境 在博弈论中,用餐者困境是一个多参与者的囚徒困境。设想的情景是有若干人出去吃饭,在点菜之前他们达成了一致:所有人平摊买单的钱。现在,每个人要么点贵的菜肴,要么点便宜的菜肴。假设贵的菜肴比便宜的要好,但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得。每个人都这么推想:众人将会点便宜的菜肴,而由于点了更贵的菜肴而额外加的钱将被众人摊分,所以额外加的钱是很少的,而菜肴的味道却会有较大的改善,因而多花这点钱是划算的。每个人都这样推想,最后的结果是他们都花钱点了更贵的菜肴,而原本他们认为点便宜的菜肴要比点贵的对每个人都要好些。 形式定义和平衡分析 用g表示从享用贵的菜肴中得到愉悦,b表示从享用便宜的菜肴中得到的愉悦,h表示为贵的菜肴付的钱,l表示为便宜的菜肴付的钱,n表示用餐者的人数。从上面的描述中我们可以得出如下顺序:h > g > b > l。而且,为了使这个游戏更类似囚徒困境,我们假设,在给定其他人都会帮助买单的前提下,人都是更喜欢贵的菜肴的,。 考虑由某个参与者的对抗决定的任意一组策略。令其他的参与者的菜肴的总成本等于x。那么,点便宜的菜肴的成本是,而点贵的菜肴的成本是 。所以,如果点贵的菜肴,每人的从中得到效用是,而如果是便宜的菜肴,则是。假设从贵的菜肴中得到的效用更高。记住,对抗者们的策略选择是任意的,并且形势是均衡的。这证明贵的菜肴是严格占优的,因而是唯一的纳什均衡。 如果每个人都点贵的菜肴,所有用餐者都支付h,那么得到的总效用是g − h < 0。换句话说,假设所有人都点便宜的菜肴,那么他们的总效用会是b − l > 0。这就揭示了用餐者困境和囚徒困境的相似之处。像囚徒困境一样,每个人得境况都因唯一的均衡结果而变差,而如果他们都一致地选择另外一个策略的话,大家的境况都将变好。 实验性证明 Gneezy,Haruvy和Yafe于2004年在一个现场试验中检验了这些结论: 每组六个用餐者选择不同的菜单组合。果然正如所料,当大家一起平摊费用时,受实验者比每人单独付钱时消费了更多菜肴。当菜肴是免费时,消费量最高。最后,某些组的成员只需要支付相当于他们个人费用的六分之一。这些组的消费量和平摊费用的消费量没有差异。因消费量增加而增加个人的费用,在两种支付安排下都是一样的,但是平摊费用对组里的其他成员施加了负担,这意味着在做选择时,参与者并不会把其他人的负担考虑进去。这与大量在实验室进行的试验结果不同。在实验室环境中受实验者面对的是从实验设计来看相似的选择,但这些选择的背景要比实际情况抽象得多。实际结果与实验室的试验的差别极有可能源于实验室环境与真实场景的差异。 参考文献 1Glance, Huberman. (1994) "The dynamics of social dilemmas." Scientific American. 2Gneezy, U., E. Haruvy, and H. Yafe (2004) "The inefficiency of splitting the bill: A lesson in institution design" The Economic Journal 114, 265-280.
演化均衡(Evolutionary Equilibrium) 目录 1 什么是演化均衡 2 演化均衡与演化稳定策略、纳什均衡之间的关系 3 相关条目 什么是演化均衡 为了更好地描述动态的演化过程,把演化博弈理论中的静态概念与动态过程统一起来,荷什勒佛(Hirshleifer,1982)提出了演化均衡的概念。按照荷什勒佛的概念,若从使得动态系统的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点,则称该平衡点是局部渐近稳定的,这样的动态稳定平衡点就是演化均衡。 演化均衡与演化稳定策略、纳什均衡之间的关系 众所周知,演化稳定策略是纳什均衡的精炼。那么,演化均衡与演化稳定策略、纳什均衡之间的关系是怎样的呢?弗里德曼(Friedman,1998)指出: (1)每一个纳什均衡都是动态系统的平衡点; (2)演化均衡一定是纳什均衡; (3)演化稳定策略不一定是演化均衡。 复制者动态方程可以保证演化稳定策略为演化均衡,但在一般的动态方程中演化稳定策略却既不是演化均衡的充分条件也不是演化均衡的必要条件。弗里德曼还认为,演化博弈论中最为有用、运用最为广泛的均衡概念并不是演化稳定策略,而是演化均衡。因为行为按照某种动态随时间变化的假设是合乎情理的。 相关条目 演化稳定策略 纳什均衡
什么是运动场悖论 运动场悖论是芝诺(Zeno)提出的四个悖论(两分法、阿基里斯(Achilles,荷马史诗《伊里亚特》中的善跑猛将)追龟说、飞箭静止说、运动场悖论)中的第四个。 运动场悖论的大意是:跑道上有两排物体,大小相同且数目相同,一排从终点排到中间点,另一排从中间点排到起点.它们以相同的速度沿相反方向作运动.芝诺认为从这里可以说明:一半时间和整个时间相等。亚里士多德接着指出:“这里错误在于他把一个运动物体经过另一运动物体所花的时间,看做等同于以相同速度经过相同大小的静止物体所花的时间。事实上这两者是不相等的。” 首先假设在操场上,在一瞬间(一个最小时间单位)裡,相对于观众席A,列队B、C将分别各向右和左移动一个距离单位。 □□□□ 观众席A ■■■■ 队列B・・・向右移动(→) ▲▲▲▲ 队列C・・・向左移动(←) B、C两个列队开始移动,如下图所示相对于观众席A,B和C分别向右和左各移动了一个距离单位。 □□□□ ■■■■ ▲▲▲▲ 而此时,对B而言C移动了两个距离单位。也就是,队列既可以在一瞬间(一个最小时间单位)里移动一个距离单位,也可以在半个最小时间单位里移动一个距离单位,这就产生了半个时间单位等于一个时间单位的矛盾。因此队列是移动不了的。 目录 1 相关条目 相关条目 芝诺悖论 两分法悖论 飞矢不动悖论 阿基里斯悖论
概述 鹰鸽演进博弈的的稳定演进策略共有三种: 一种是鹰的世界,即霍布斯的原始丛林; 一种是鸽的天堂,既各种乌托邦; 还有一种是鹰鸽共生演进的策略,这要求混合采取强硬或者合作的策略。由此产生了进化稳定策略(evolutionarilystablestrategy),也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。 进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,集团的胜利以及集体的止步不前。 应用鹰鸽博弈的存在,正好也可以说明了一点,为什么在人类的历史上会有战争不断地出现。就像古代中国和高丽他们之间的实力明显很大的差异,古代中国就像鹰鸽博弈中的鹰,而高丽就是鸽。高丽从古到今400年的历史连起来被中国灭了不下20次。每次发动战争的原因各有不同,但是每次都存在两个国家的利益之争。 如果没有利益的驱动,两个国家之间的战争就不会出现。而且如果两个国家的实力相同的话,战争的可能性也就不大。最主要的原因在于世间不同的国家他们的实力没有是势均力敌的,他们之间的实力会不断的变化。战国的时候会有不同的国家成为霸主,也正是因为在六国之中有一个国家的实力超出了其他的五个国家。有一个霸主出现的时候,世间的战争就会停止。然后,随着时间的推移,六国之间的实力会因为各国国王的改变或是政策的改变产生了不同的变化。后者居上的心理不会甘愿受之前霸主的牵制与管理,新的一轮战争就又会出现,直到下一个平衡的出现。 每次战争的出现都会使得战争的双方受到严重的损失,但因为两个国家之间会有各自不同的利益。并不只是霸主的位子,更多的是因为霸主位子带来的经济与军事实力上的认可。强者会受到各国的战后经济上的补偿,也同样的给战胜国的人心中以一种无比骄傲的心情。谁都会想到两个国之间的利益在合作的时候会达到最大,却又会在一种投机的心理下产生如果我侵略,而对方是一种和平的态度,就会有更大的利益,于是战争就开始了。因为存在这样的投机心理所以世间的和平总是暂时的,均衡会被打破,却又会在一段时间后重新趋向于和平。 两国之间的最优状态是和平,也就是平时所讲的帕累托最优。但会因为外界的各种因素,而在不断地改变。就像微观经济学中的供需关系,需求和供给在不断的变化,总会偏离均衡,却总有到均衡。[1]
概述 子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾(Reinhard Selten). 泽尔腾则在60年代中期将纳什均衡概念引入动态分析。在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。 将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。 由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。 用动态博弈理论来讨论实际究竟发生哪个纳什均衡。 给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。 只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 定义子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。 对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。 博弈论专家常常使用“序惯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法: 最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。 完全信息动态博弈动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。 动态博弈的纳什均衡的意义子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。 求解法逆向归纳法(Backward Induction)是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈均衡的方法。 用逆向归纳法求解子博弈精炼纳什均衡;承诺行动与子博弈精炼纳什均衡;逆向归纳法与子博弈精炼均衡存在的问题。 应用举例在表1描述的博弈模型中,每一次微观主体间的博弈均可看作一个子博弈。子博弈精炼纳什均衡包含两层含义: (1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。 子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则。 子博弈精炼纳什均衡 在表1中,a代表只有一个微观主体创新时所带来的收益,c代表该微观主体创新所需付出的成本。当只有一个微观主体进行创新时将会获得创新带来的全部收益(a-c),而当两个主体同时创新时,收益将会减半(a-c)/2。一般情况下“a-c>0”,则很明显在这个博弈过程中,(创新,创新)是一个纳什均衡,更严格地说,是一个严格优势策略均衡。依此类推,可以得出,在每一次新的金融规制后,(创新,创新)这个策略都将是至下次新规制出现前的子博弈的纳什均衡。因此,在利润的驱动下,微观主体都会选择创新这样一个策略。 举例分析在市场进入博弈中,在给定企业B已经进入的情况下,在位者的“斗争”,“高价”策略已不再是最优的,这种“斗争”是不可置信的威胁,因为斗争的结果是没有利润;而合作会带来50单位利润。所以,(进入,高价)不是一个精炼纳什均衡。剔除这个均衡,可以证明,(进入,高价)是唯一的子博弈精炼纳什均衡。[1] 在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。 利用房地产开发的例子,讨论子博弈精炼纳什均衡。表2给出了静态条件下双方参与人的收益情况。 表2 房地产开发博弈(静态)的收收益矩阵 子博弈精炼纳什均衡 从表2可以知道,该博弈有两个纳什均衡,即(A开发,B不开发)和(A不开发,B开发),我们无法确定是开发商A选择开发,开发商B选择不开发,还是恰恰相反的结果。 现在,我们讨论动态博弈。假定房地产开发商A是先行动者。在行动之前,开发商A对对手开发商B的策略进行了预测。在行动开始之前的A看来,如果不计得失,B有四种策略可供选择: 策略一:无论A是否选择开发,B选择开发。 策略二:若A选择开发,B也选择开发;若A选择不开发,B也选择不开发。 策略三:若A选择开发,B就选择不开发;若A选择不开发,B就选择开发。 策略四:无论A是否选择开发,B都选择不开发。 在表2的基础上,结合A先行动,B可能选择的四种策略,不难得出表3。 表3 先行动者A对B预测结果的收益矩阵 子博弈精炼纳什均衡 由表3可以看出,在开发商A先行动的情况下,开发商B可供选择的策略中,策略一只包括了上述两个纳什均衡中的后一种均衡,即(A不开发,B开发),而没有包括前一种纳什均衡,即(A开发,B不开发);策略二上述两种纳什均衡都没有包括;策略四只包括了上述两种纳什均衡中的前一种均衡,即(A开发,B不开发),而未包括后一种纳什均衡,即(A不开发,B开发);只有策略三既包括了上述两种纳什均衡中的前一种均衡,又包括了后一种均衡。也就是说,如果B选择策略三,那么,无论A作出什么选择,B的回应都能达到纳什均衡。反过来,在给定B会选择策略三来回应A的选择的前提下,开发是A的占优选择。因此,A一定会选择开发
布阿吉尔贝尔的税收思想(Boisguillebert's taxation thought) 目录 1 布阿吉尔贝尔的税收思想概述 2 阿吉尔贝尔的税收思想 3 布阿吉尔贝尔简介 布阿吉尔贝尔的税收思想概述 布阿吉尔贝尔(P Pierre Le Pesant, sieur de Boisguillebert)所提出的许多经济理论和政策观点,后来被发展成为重农学派的理论体系和经济纲领。其税收观点是在批判重商主义的财政税收政策形成的。主要体现在: (1)关于税收的源泉。布阿吉尔贝尔认为,真正的财富是使用价值,它不仅包括生活必需品,还包括非必需品以及能够满足人们身体功能快乐的一切物品,而财富的增长只有靠土地的生产。他说:“耕种者的繁荣昌盛是一切其他等级的财富的必要基础”,“一切的财富都来源于土地的耕种”。所以,“财富和随之而来的税收除土地和人类劳动之外,没有其他来源”。 (2)关于税收与农业生产的关系。他认为,法国当时的重税使农业生产遭到破坏,使土地荒废。税收对农业生产产生不利影响的第一个原因是任意规定的达依税。达依税是法国当时按人口和产业向平民征收的人头税。他说:“达依税变化不定,完全任意配征而无固定的税则,只有一点固定不便,即愈贫者纳税愈重,于是人们就愈要去开发属于无保障者的土地”。酒税、关税和通过税繁重是破坏农业生产的第二个原因。布阿吉尔贝尔指出,“土地荒废的第二个原因,即耕种之后货物卖不掉,所以索性不种,是由于酒税、出口关税、王国内部的过境税等是商品所能承担的4倍”。税务官员的横征暴敛不但加重农民的税收负担,而且影响了农民的正常活动。所以,他呼吁减轻赋税,重视农业生产。 (3)关于税制改革。他指出,赋税的基础最初是通过与物质生产有关的无数因素间的谐调,税收就要减少。因此,他视经济社会为一个统一体,把经济发展的谐调关系作为税制改革的目标。他主张:第一,税制应避免对农民课税过重。其建议有整顿不适宜的间接税代之以直接税;改革人头税;撤消补助金、国内关税制度;征收炉灶税、什一税等。第二,废除柯尔培尔政策对国内商业——关税——的限制,以扩大国内商业,促进行业分工,加快货币与商品流通。第三,通过谷物自由贸易与扩大市场,准许谷物价格自然上涨。布阿吉尔贝尔以发展法国经济与提高国土及人民的经济福利为出发点,把按财产多寡实行公平征税作为努力的目标,实现贫者少缴,富者多缴。 阿吉尔贝尔的税收思想 阿吉尔贝尔的税收思想主要有: 1 批判柯尔培尔重商主义政策,认为国家应保护农业,而不是工商业。 2 分析了人民贫困与财政贫乏间的因果关系。指出赋税制度以及包税制致使农业贫困化。 3 提出改革旧税制的三大主张。 布阿吉尔贝尔简介 布阿吉尔贝尔(1646-1714年),法国古典政治经济学的创始人,重农学派的先驱。他的主要经济著作有《法兰西详情》、《谷物论》、《论财富、货币和租税的性质》等。曾任法官及法院院长。面对当时农村凋敝,生产萎缩,财政经济混乱等而极力反对重商主义。认为农业才是真正的财富。反对国家干预经济,主张经济自由。主张谷物自由输出,减少间接税,公平分配租税负担。