黑暗森林中的博弈
笨笨老猫、吃饱撑的、白白是“量化金融实验室”的创始人,这个实验室致力于研究并实践量化交易策略。在策略模型的构建过程中他们遇到了很多博弈论的问题,于是他们近期开始研读一本科幻小说《三体》,作为理解博弈论原理的实践材料。
《三体》是刘慈欣写的一部关于宇宙文明竞争的科幻小说,在中国科幻中可谓独树一帜。在书中,他提出了著名的“黑暗森林”法则:宇宙中存在很多文明,每个文明就像黑暗森林中的猎人,生存的最高原则就是隐藏自己以免沦为其他文明的猎物;而那些有意无意暴露自己存在的文明,迟早会被暗藏的更高级文明消灭。
刘慈欣是根据两条公理和两个基本概念推导出“黑暗森林法则”的,这两个公理是:
第一,文明的目标是生存。
第二,宇宙的物质总量不变。
两个概念是猜疑链和技术爆炸。
故事情节是这样的:距离太阳系最近的恒星系α半人马座有一个叫做“三体”的文明,他们世代饱受无规律运行的太阳引发的各种灾难并进化到很高的文明水平。正当他们希望在宇宙寻找生存环境更好的星系之际,三体文明收到了临近星系—太阳系中人类文明的邀请,于是三体文明决定派出大规模舰队入侵太阳系并灭绝人类文明。《三体》就是讲述人类如何面对巨大的文明差距,与比自己先进很多的三体文明进行生死决斗的故事。
罗辑是小说中拯救人类的英雄,他发现虽然三体文明远远高于人类,但是三体仍然受到“黑暗森林”法则的制约:三体文明十分忌惮在攻击人类的过程中暴露三体星系和太阳系的坐标,因为这样就等于在召唤更高级的宇宙文明的无情打击。于是,罗辑建立了一个向宇宙发射三体星系坐标的广播系统,并以此威胁三体文明做出了“和平共处”的选择。
以下是他们在QQ群中的讨论:
笨笨老猫:
在网上的三体吧里,最近有人在论证逻辑矛盾。说发现文明就攻击,就会导致自己暴露,则招惹高级文明攻击你,这违反第一公理。我估计大刘可能真的不知道博弈论。
吃饱撑的:
不是吧?小说里那么多博弈论的相关内容。
笨笨老猫:
其实他费劲建立的黑暗森林,就是一个具体的囚徒困境模型,没必要另起名号,导致很多人攻击逻辑硬伤。他是涉及博弈论的内容,但选择了“民间”的表述方式。
注解:囚徒困境是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱,单独审讯不能互相串供。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢半年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
吃饱撑的:
我看到罗辑第一次向宇宙发咒语时就想到囚徒困境模型了。
笨笨老猫:
我描述一下这个模型:一间很大的黑屋子里面关进去几个犯人,警察告诉他们里面一共100元,还有绳子刀子手枪等武器。给你一天时间,只要你活着出来,放你自由,多少钱都归你。这就是等价于黑暗森林的模型。第一公理,要生存;第二公理,要占有更多的钱,一共100元,即所谓宇宙物质总量不变。
现在博弈论题目来了:你在黑暗中摸索出30元,接下来你要不要攻击对方获得更多钱?
白白:
可以画出收益矩阵。
吃饱撑的:
肯定攻击,不攻击也有被攻击的危险。这个模型在耶鲁的博弈论公开课里有讲。
笨笨老猫:
如果你攻他不攻,收益是你俩资产的总和;如果对攻,都死掉,收益为0;当然了,如果你不攻击,他攻击的话就是你死。
白白:
必须继续攻击。
笨笨老猫:
假设就俩人,那人已有70元,写出收益矩阵,是不是存在不严格的优势策略?
白白:
第一原则是生存,我可以不要100块但我只要活着就行。
笨笨老猫:
你是否活着,现在就等价于你有多少钱了。除了同归于尽,要满足第二公理,第二公理:一共100元,总量不变。
吃饱撑的:
首先要画出敌我双方各种选择的收益矩阵,比如敌我双方都保持和平,我的收益是就是我有多少钱,30元,敌人的收益是70元;我攻击敌人,而敌人保持和平的情况下,我会得到全部的100元,敌人当然死了,所以什么也没有。以此类推,如果互相攻击,同归于尽,双方收益都是0元。

笨笨老猫:
现在问题是,有没有优势策略?为什么是?
吃饱撑的:
有啊,攻击是优势,因为收益大于不攻击。
笨笨老猫:
不准确,第一行就不符合你说的。上面的收益矩阵没有疑义吧?那有没有优势策略?为什么?我简化问题:攻击是不是优势策略?
白白:
不是优势策略。
笨笨老猫:
那你为什么要攻击?或者我反过来问,都不攻击是最差策略么?
其实吧,答案很明显,当然是攻击,但要知道为什么攻击。逻辑要清楚,不在于判断,而在于推理过程。
白白:
对敌人而言和平绝对是最差的,但是对我来说和平是……
笨笨老猫:
你和对方除了钱不一样,完全对称的,既然他最差,你怎么会不是?
笨笨老猫:
什么叫优势策略?就是在敌人的任何选择下,你当前的选择都是最好的。还有一种非严格的优势策略就是在敌人的任何选择下,你当前的选择都是最好的结果之一。我们根据这个概念分析,显然没有最优策略。因为当对方选择攻击时,我的得分都是0,两个0没有哪个更好的区别。
但是有非严格的优势策略:如果对方选择攻击,我的得分都是0,那么是最好的结果之一;如果对方选择和平,我攻击得分100,和平得分30,当然攻击是最好的结果。也就是说,无论对方如何,攻击都是最好的结果或者之一,这才是推理过程。所以这个结论有了,就是攻击。
笨笨老猫:
现在回到三体的黑暗森林,你们说谁是地球?谁是三体?
吃饱撑的:
地球资源多,所以是70的那个。
白白:
地球30。
笨笨老猫:
有分歧,如果把文明的生存环境作为资产,谁的环境好?
白白:
恩,地球的生存环境好,应该是70。
笨笨老猫:
对,当然地球好,不然三体不远万里来地球做什么?
笨笨老猫:
接着一个问题:假如绳子和刀子这两种武器,代表技术水平,谁有刀子?
白白,吃饱撑的:
三体文明。
笨笨老猫:
对,我们再把模型具体化一下:那个有30元的哥们手里有刀子,手里有70元的有绳子。那么,有绳子的哥们是不是应该出声问:有人么?
吃饱撑的:
不应该,必须躲起来。
白白:
出声的是疯子!
笨笨老猫:
那再问:有刀子的哥们是不是应该问:有人吗?
白白、吃饱撑的:
那是作死!
笨笨老猫:
因为他知道,还有人手里有枪啊!
白白:
不是就2个人么?
笨笨老猫:
他不知道对方手里是什么,都是摸黑捡的。
笨笨老猫:
现在回到三体,有两个概念:
1、猜疑链。就是“我不知道你咋想的,你不知道我是咋想你的,我不知道你知不知道我是咋想你的...”为什么有猜疑链?因为大家的最优策略都是攻击,所以不能发出声音也不能交流。
2、啥事技术爆炸。就是拿着绳子那兄弟,继续摸黑,结果捡到一只手枪!这就是技术爆炸。就算拿刀子那哥们知道对方是绳子,觉得没有威胁。但是对方万一摸到一把枪,就技术爆炸了。
所以现在的最优策略是:第一,不要发出声音;第二,在黑暗里摸索着找钱和更先进的武器;第三,一旦发现对方,不择手段的干掉他。这是一个完全等价的“黑暗森林”。
笨笨老猫:
我们再说一说罗辑的策略:假如那个拿绳子的人被拿刀的发现了,拿刀的已经向他走过去,同时拿绳子的也知道拿刀的过来了。他该怎么办?罗辑的策略是:嘿,哥们儿!你敢过来,我就点蜡烛!
拿刀的人知道对方拿着绳子,也就是说枪可能在另外一个人的手上,而且这人还没有暴露自己。那么他是不是去攻击?显然,如果他继续攻击,蜡烛被点燃后自己也暴露了,虽然他可以干掉拿绳子的,但同时难逃被拿枪人干掉的厄运。所以他只有不攻击才能暂时存活。
笨笨老猫:
能写出罗辑的博弈模型和收益矩阵么?
有点儿难,我来写吧:

笨笨老猫:
收益矩阵解释:
如果三体与人类和平相处,同时罗辑保持沉默的话,三体和人类各得1分(各自保持对原有星球的控制)
如果三体与人类和平相处,而罗辑广播了三体坐标,由于两个星系很近,也就等于暴露的太阳系的坐标,那么按照“黑暗森林”法则,两个星系迟早被其他文明毁灭,双方各得0分。
如果三体攻击人类,而罗辑广播了三体坐标,按照上面的道理双方仍然各得0分。
如果三体攻击人类,而罗辑保持沉默,那么三体将胜利,得1分;而在罗辑的价值观里“坐以待毙”要比“同归于尽”更差,所以这种情况下人类不是得0分,而是-1分
博弈推理:
1、在这个博弈中三体与罗辑都没有优势策略。罗辑无论选择暴露坐标或是保持沉默都不能保证是优势策略;相反,在三体文明无论选择攻击还是和平,也都可能不是优势策略。
2、在这个博弈中存在两种纳什均衡点(0,0)、(1,1),在任何一个均衡点上,任何当事一方如果改变策略将受到惩罚。
在《三体》小说中,罗辑将三体文明拖入了收益为(1,1)的均衡点,如果三体改变和平策略而攻击地球,这将招致罗辑也改变策略,转而向宇宙广播地球和三体的坐标,双方收益将变为(0,0),达成另一个均衡,当然这是最差的均衡;反之,如果三体保持和平共处的前提下,罗辑改变选择悍然启动坐标广播,也会达到(0,0)的结果。
笨笨老猫:
这里我要强调的是罗辑和三体的收益矩阵,收益矩阵实际上反映了博弈双方的价值观,价值观不同,收益矩阵当然不同。顺便提一下《三体》第三部的主人公程心,她和三体的收益矩阵是这样的:

主要的差别是,在她看来“坐以待毙”和“同归于尽”都是灭亡,没差别,都是零分。恰恰是这一点微不足道的价值观差别,导致了一个“优势”策略的产生,就是,无论三体如何对待人类,程心都会保持沉默!你们可以按照上面的方法证明这一点。
而三体非常清楚程心和罗辑价值观的差异,所以就在程心接替罗辑的同时立即就发起了对人类的攻击,结果可想而知……
笨笨老猫:
这就是罗辑根据黑森林法则所设计出来对付三体文明的博弈策略。想想中国A股的庄家博弈,跟这个有什么区别?你被我知道了,资金越大越被动。
吃饱撑的:
中金所公布持仓数据也相当于把黑暗森林点亮了……
交易技术, 交易策略
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!
