博弈中的“承诺”(commitment)(三):再谈煤电博弈,(6)

从本质上讲,承诺行动(Commitment action)就是在博弈开始之前参与人采取的某种改变自己支付或行动空间的行动,该行动可使原本不可信的威胁变得可信。在许多情况下,承诺行动对参与人来讲是有利的,因为它能使博弈的精炼均衡发生有利于自己的改变。但参与人的承诺行动是有成本的,否则这种承诺就是不可置信的。如煤电博弈中,2011年前8个月,华能等五大发电集团电力业务亏损超过

子博弈精炼纳什均衡解的存在性与合理性

摘要:完全信息博弈是一种理论模型(十分理想化的博弈),因而对博弈中的有关条件作了相当严格的要求。对于有限完美信息博弈,存在如下定理:(Kuhn定理)每个有限的扩展式博弈都存在子博弈精炼Nash均衡。定理的“有限”条件,可以理解为博弈树有限。子博弈精炼纳什均衡的存在性由纳什均衡的存在性定理保证,只需将纳什均衡存在性定理应用到子博弈上,结合逆向递归法即可。尽管Kuhn定理保证了

博弈中的“承诺”(commitment)(四):持续的煤电博弈,(7)

在煤电博弈中,2011年前8个月,华能等五大发电集团电力业务亏损超过100亿元。国家电监会统计表明,上半年全国火电企业亏损面达53.63%,16%的火电企业资不抵债。对于上述威胁,究竟有多少是可置信的呢?进口国外优质动力煤?一方面短期不现实,2010年进口动力煤在发电用煤占比尚不到10%,即使以后增大进口,但国内外价格差会迅速弥补,很可能重复油价高企的老路。政府管控?行政性

子博弈精炼纳什均衡的应用(一):轮流出价讨价还价博弈,(8)

动态博弈的理论中有一种特殊的形式,就是讨价还价理论(bargaining theory),它是典型的动态博弈问题,也是博弈论中最早研究的一种博弈问题,它在动态博弈理论中占据着重要的位置。由于该理论应用的广泛性和内容的重要性, 它也一直备受博弈论专家的关注。轮流出价讨价还价博弈(bargaining game of alternating offers)模型是著名的博弈论专

[知识回顾]子博弈精炼纳什均衡的应用(二)——Stackelberg寡头竞争模型

斯坦尔伯格模型揭示的是完全信息动态条件下的对策均衡问题。市场厂商的行动也是选择业务量或用户数,但在斯坦尔伯格模型中,厂商1是领先厂商,首先选择其业务指标q1;竞争对手2是尾随厂商,观测到厂商1的行动后,选择自己的业务指标q2。假定逆需求函数为,厂商有相同的不变单位成本c≥0,那么,支付(利润)函数为:。应用逆向递归法求解此SPNE从上图比较中可以看出:斯坦克尔伯的均衡总

赵汀阳:博弈问题的哲学分析(二)

人们所能够期望的只是一个“比较好”的制度。一般来说,制度总是一个共同体成员自由选择的一个均衡结果,它使得每个成员在理性地思考自己的利益时,总是没有积极性愿意打破这一均衡,它大致满足纳什均衡的条件。但是一个好的制度却需要比这种纳什均衡有着更多一些的限定(正如我们看到的,纳什均衡在更多的情况下虽然能够保证人们不比别人更吃亏,可是也不能达到最大利益,因此终究不是众望所归的)。不过

赵汀阳:博弈问题的哲学分析(一)

2002年8月21日纳什在京作了“在非合作博弈中通过代理人而达成合作的研究”的报告,这是纳什尚为完成的一项研究。虽然没有听到本来所期待的结论,但我其实不太相信博弈论这样深刻复杂的研究能够获得“最后的”结论。这种哲学的怀疑论态度或许不太礼貌,尤其今天博弈论已经取得辉煌成就而成为在数学、经济学、生物进化和社会分析等领域里极具影响力的理论。从哲学的角度对博弈问题进行分析可能另有一

[知识回顾]重复博弈

从经济学的角度来看,人与人之间合作生产的一个原因是这种做法对于参与者双方而言是有利可图的,为了说明这一点我们将用到重复博弈。另外,经济中的长期关系、人们的预见性、未来利益对当前行为的制约、长期合同、回头客、长客和一次性买卖的区别、有无确定的结束时间等现实因素也使得博弈并非一锤子买卖,长期重复的现实性在理论研究中的重要性必须予以重视。重复博弈提供了用非合作博弈理论来研究合作的

[知识回顾]囚徒困境模型中的重复博弈

现在我们考虑经典的囚徒困境模型,如果博弈重复无穷次,结果如何?静态博弈:两阶段动态博弈(以该博弈作为原博弈G重复两次):第一阶段通过逆向递归法,本阶段的纳什均衡为(坦白,坦白)即(-8,-8)第二阶段,即将最后阶段的收益(-8)添加到第一阶段的矩阵中,即:在已知第二阶段结局的情况下,本阶段的纳什均衡为(坦白,坦白),即(-16,-16)对于两次重复的囚徒困境问题,总是坦

看完之后无法淡定的10个著名思想实验

10.电车难题(The Trolley Problem)“电车难题”要数伦理学领域最为知名的思想实验之一,其内容大致是:一个疯子把五个无辜的人绑在电车轨道上。一辆失控的电车朝他们驶来,并且片刻后就要碾 压到他们。幸运的是,你可以拉一个拉杆,让电车开到另一条轨道上。但是还有一个问题,那个疯子在那另一条轨道上也绑了一个人。考虑以上状况,你应该拉拉杆吗?解读:电车难题最早是由哲学

无名氏定理,(9)

在无穷重复博弈G(∞, δ)中,V=(V1…Vn)是行为人在G中所能达到的最大的极小策略报酬,考虑U=(U1…Un)是阶段博弈报酬,而且Ui≥Vi,对所有信息集均成立。则可找到一贴现率δ<1使得对所有δ>δ,U=(U1…Un)是G(∞,δ)博弈的子博弈完美均衡报酬。无名氏定理描述的是,在无限次重复博弈中,若δ足够大(参与人有足够的耐心),则任何满足个人理性的策略组合都可以通

[知识回顾]声誉模型-初步

所有动态博弈的中心问题是可信任性,这就需要以重复博弈为条件。然而现实生活中很难达到无穷期博弈,而出现的往往是有限次博弈。譬如在车站(地铁)和旅游景点这些人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为在商家和顾客之间“没有下一次(几乎没有惩罚的威胁)”。罗伯特·奥曼(1959)指出,人与人的长期交往是避免短期冲突、走向协作的重要机制。现实生活中反复交往的人际关

[知识回顾]扩展式博弈中的纳什均衡(一)

定义:一个给定的扩展式博弈Γ的纳什均衡也是从Γ中推导出的博弈G的纳什均衡。回忆一下,这个博弈的混合策略纳什均衡是:定理:对于任意具有完美信息的扩展式博弈Γ,存在一个行为策略的纳什均衡。一般的,求解一个扩展式博弈的第一步就是找出它的所有纳什均衡解。这一定理告诉我们至少有一个这样的均衡解存在。此外,如果我们找到了由其推出的正常表达下的纳什均衡解,那么我们就找到了扩展式博弈下的所

重复博弈,蒙牛输了!

蒙牛输了?蒙牛也输过么?故事还要从北京刚刚申奥成功说起。2004年,蒙牛为每一位国家队运动员都配置了“牛奶套餐”,开始为竞标做热身运动。2005年9月1日,蒙牛宣布,从当天起,北京市民每购买一袋蒙牛牛奶,蒙牛就捐赠一分钱,用于北京奥运会公益活动志愿者的选拔和培训。而之前,蒙牛就曾给北京申奥捐款1000万元。蒙牛一副志在必得的架势,伊利也没有闲着。2005年11月初,伊利出资

[知识回顾]扩展式博弈中的纳什均衡(二):Selten的博弈

忽略扩展式博弈的动态特征这并不令人惊讶:毕竟我们是通过将是将这一元素完全去掉来获得策略式博弈的表现形式的。Reinchard Selten在他1965年的一篇文章中第一个提出一些纳什均衡解比其它的均衡解“更加理性”。他用下图的例子来探讨这一命题,我们也采用这一例子来展开讨论。博弈论, 博弈, selten, 均衡原文发布于宽客论坛,点击阅读原文

点球中的博弈论:守门员扑向何方?

自古无数豪门,一遇点球都歇菜。点球大战之所以可怕,就在于它充满变数和意外,这种变数对那些飞奔了 120 分钟的球员来说,实在是沉重的心理负担。当球员走上点球点时,他会选择把球射向哪边?而守门员又会扑向哪边?这无疑是一场博弈,经济学家和统计学家对此就做过不少研究。经济学家的研究在观看过法国与意大利国内联赛中共 459 个点球的录像后,《魔鬼经济学》作者 Steve Levit

胆小鬼博弈:如何假装死磕到底

假设这样一种情形:两名赛车手各自驾驶汽车沿着一条划定的直线相向而行,相撞前首先转向的一方就是“胆小鬼”,英语中常用 chicken 来形容胆小的人,所以这个假想游戏也被称为 chicken game。虽然听起来有些荒诞,不过在电影和现实中这种情境并不少见,比如《天下无贼》中刘德华与黎叔手下的四眼在火车顶上“比胆”,两人站在疾驰的火车上,迎面而来的是黑洞洞的隧道,先蹲下的那个

史上玩的最大的胆小鬼博弈:古巴导弹危机

昨天我们说到了“胆小鬼博弈”。历史上玩的最大的胆小鬼博弈可能就是古巴导弹危机了。 1962年,为报复美国在意大利和土耳其部署的针对苏联的核导弹,苏方在古巴境内秘密部署针对美国的核导弹,但这一举动很快被美国发现。一时间美苏双方针锋相对,互相威胁将冷战升级为热战,在 13 天的危机交涉中,双方军队在加勒比海地区险些擦枪走火。最终双方相互妥协,苏联撤走了部署在古巴的导弹,美国保证

表白中的纳什均衡

在约翰纳什的传记电影《美丽心灵》中就有很好的例子,纳什和他的四个男伙伴在酒吧,而对面正好有五个单身女生,其中一个最为漂亮。如果纳什和他的四个男伙伴都去追求最为漂亮的女神,那么女神就会不知道同意谁而全部拒绝。追求女神不行,接下来追求剩下的四位女生,这四个女生当然也不会同意,因为没人愿意屈居第二,当剩下的。这样就会造成谁也没有搭讪成功。如果纳什他们改变策略,每个人选择自己的最优

“海盗分金”新说

海盗分金是一个非常古老的问题,在1999年《科学美国人》正式把它发表之前,已经至少流行10年了,相信很多人都有所耳闻,也知道解法。今天我们就来回顾一下这个有意思的问题,并且在把问题推广到大规模海盗团伙后,会得出一些非常有意思的结论。分金的规则有五个非常聪明的海盗,他们都是死理性派,编号分别是P1、P2、P3、P4、P5。他们一同抢夺了100个金币,现在需要想办法分配这些金