[知识回顾]声誉模型-初步
所有动态博弈的中心问题是可信任性,这就需要以重复博弈为条件。然而现实生活中很难达到无穷期博弈,而出现的往往是有限次博弈。譬如在车站(地铁)和旅游景点这些人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为在商家和顾客之间“没有下一次(几乎没有惩罚的威胁)”。
罗伯特·奥曼(1959)指出,人与人的长期交往是避免短期冲突、走向协作的重要机制。现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。奥曼证明了,在较长的视野内,可以使自利的主体之间走向合作。
博弈论最初对声誉的关注主要是集中于与声誉密切相关的策略“可信性”问题上(“可信性”是声誉产生的一个重要的基础)。1982年,Kreps、Milgrom、Roberts和Wiison在一篇经典的文献中构建了一个声誉模型,该模型通过引入非对称信息,研究供应链合作关系及其隐性影响因素研究了在不完全信息重复博弈中经济主体之间合作行为的可信性问题,即不完全信息条件下有限次重复博弈中的合作均衡生成机制问题,这就是在信息经济学、博弈论以及产业组织理论中都非常有影响的“KMRW声誉模型”。该模型证明:参与人对其他参与人支付函数或战略空间的不完全信息对均衡结果有重要影响,合作行为在有限次重复博弈中会出现,只要博弈重复的次数足够长。尤其,“坏人”可能在相当长一段时期表现的像“好人”一样。 当只进行一次性交易时,理性的参与者往往会采取“机会主义”行为,通过欺诈等“非声誉”手段来获取自身的最大化收益,其结果往往是“非合作博弈均衡”。但当重复多次交易时,为了获取长期利益,参与者通常需要建立自己的“声誉”,一定时期内的“合作博弈均衡”就能得以实现。
KMRW定理:在T阶段重复囚徒博弈中,如果每个囚徒都有p>0的概率是非理性的,即只选择“针锋相对”(tit-for-tat)或“冷酷策略”(grim strategy),如果T足够大,那么存在一个T0,使得下列策略组合构成一个精炼贝叶斯均衡:所有理性囚徒在t≤T0阶段选择合作,在t>T0阶段选择不合作;并且,非合作阶段的数量(T0-T)只与p有关而与T无关。在经济生活中,不完全信息将会带来信息成本,但在重复博弈中这不一定是坏事。KMRW模型证明,在有限次重复囚徒困境博弈中,不完全信息(每个参与人对自己类型的了解属于私有信息,只知道对方属于非理性的概率为P可以导致合作的结果,而这在完全信息条件下是不可能的。譬如可以从国有企业内部经营者与所有者之间博弈关系的角度,构建国有企业经营者正规的声誉模型,讨论声誉对国有企业经营者的激励效应及声誉与国有企业经营绩效之间的关系。理论证明在某些情况下当交易只有有限次(甚至仅有一次)时,交易者同样有积极性建立和维持良好的声誉。
考虑这样一个例子:A、B两人各拿着一枚硬币,决定要出示正面或反面。如果两枚硬币同时以相同的面被两个参与人出示,则参与人A付给参与人B一元钱;否则,参与人B输给参与人A一元钱,其支付矩阵表示如下:

在静态博弈分析中,我们知道这是一个没有纯战略纳什均衡的纯战略博弈。但在某些情况下,参与人面临由外部环境决定的不可控条件的变化(如天气变化和宏观经济条件变化),博弈理论常将这种外生条件作为一种特别的局中人,称为“自然”(nature)。“自然”的行动选择对参与人来说事前都是未知的,但“自然”进行“行动”选择的信息集必定是单结的。对于所有信息集都是单结的扩展式博弈来说,我们可称之为“完美信息博弈”。

在上图中,参与人B在决策时不知道参与人A会选择“正面”还是“反面”,故他不知道自己在决策时到底是位于自己信息集中的哪一个决策结上。B的信息集是非单结的,所以不是完美信息博弈,但猜谜游戏却是一个完全信息博弈。在包括有“自然”这个局中人的博弈中,其他参与人通常不会知道“自然”的选择(至少不全知道,这来自于外生条件变化的不可预见性),至多只能知道“自然”以何种概率分布选择不同的“行动”(如知道天气变化的概率),这样,在包含有“自然”这个局中人的博弈中,信息就是不完全的。但当引入“海萨尼转换”后,就可以将不完全信息博弈转化为完全但不完美信息博弈。这需要将“自然”这个局中人正式表达在博弈树中。
博弈论, 博弈, 声誉, 信息
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!
