本
文
摘
要
本文字数5174,预计阅读时间10分钟。
阅读使人充实,分享使人愉悦。文章结尾附有思维导图,帮你梳理文中脉络精华。欢迎阅读,你离知识又近一步。
今天分享的书籍是《博弈论与生活》。
兰·费雪(Len Fisher)英国布里斯托大学物理系教授、纳米物理学与软物质研究所研究员、知名科普作家,热衷于与大众分享科学界的新鲜事。拥有悉尼大学、新南威尔士大学等多所名校的化学、数学、辐射化学、物理学、生物科学、哲学等学科的博士和硕士学位。
博弈论自20世纪40年代诞生以来,得到西方商界、经济学界、军事领域、社会学界的广泛应用。博弈论的观点告诉我们,面对利益的相互制约,最佳的应对策略不是冲突,而是合作;不是竞争,而是互助。作者在跨学科研究中找到了完备的科学问题处理方法,用博弈论中的合作策略为日常生活中的问题提供行动指南。
01、囚徒困境
首先最有名的博弈论的命题,叫囚徒困境。囚徒困境的命名者是普林斯顿大学的阿尔伯特·塔克。什么叫囚徒困境?它是经济学中非常著名的一个概念。
比如,你和你的搭档是两个间谍,被警察逮捕了。你们两个人被完全隔离,分别接受审讯。如果你和你的搭档都保守秘密,会被拘留一年;如果只有你保守秘密,你的搭档坦白的话,他会被立即释放,而你要入狱十年;如果只有你坦白而搭档保守秘密的话,你会被立即释放,搭档要入狱十年;两个人都坦白的话都会入狱五年。最好的方案当然是你和搭档都保守秘密,但是因为担心对方会坦白,从而导致自己可能要入狱十年,所以在囚徒困境中最保险的选择是两人都坦白。
它为什么是一个困境?因为并没有达成它可以获得的最好的状态,双方产生了博弈。囚徒困境在生活当中太多了,比如追女生。作者说,他小时候跟他弟弟同时喜欢上社区里一个新来的小女孩,然后两个人都跑到小女孩面前去说对方的坏话,最后的结果是两个人谁也追不到。这也是囚徒困境。
我们先来看一个概念,叫纳什均衡。纳什均衡的意思是,参与博弈的每一方都找到了针对另一方的最佳对策。这个理论是著名数学家、博弈论创始人约翰·纳什提出来的,所以均衡策略也叫做纳什均衡。
比如,美国有两大橄榄球联盟,一个强势,一个弱势,这两个联盟分别组织自己的比赛,强势联盟在秋季比赛,因为秋季市场最大,但是弱势联盟也想在秋季办比赛,把对手挤到春季去,那么,弱势联盟究竟该不该这么做呢?我们假定秋季有1亿人观看橄榄球比赛,而春季只有5000万人看比赛。如果两大联盟同时选择一个季节,强势联盟将得到70%的收视率,弱势联盟只有30%的收视率。也就是说,如果两大联盟同时在秋季比赛,只有3000万人会观看弱势联盟的比赛;而如果弱势联盟继续选择在春季比赛,他们还会有5000万观众。面对强势联盟,弱势联盟没有一个优势策略,它只有一个均衡选择,就是永远在强势联盟停赛期间比赛。
也就是说,在各方都选择了同一策略的情形下,没有一方能够通过独自改变策略而获益,此时的策略搭配和后续结果,就构成了纳什均衡。在生活当中,经常会出现各式各样的陷阱。
比如,离婚。离婚这件事发展到最后往往就是争财产,一开始大家都不这么认为,开始离婚的时候大家都会说,钱我不在乎。但最后发现对方真的都拿走了,就开始生气,说凭什么你这样对我。然后就开始打官司。最后你会发现大量的钱用作了律师费,用作了消耗的社会成本。原因就是双方各不退让,不愿意妥协,最后陷入到一个纳什均衡当中。这就是为什么离婚会成为一个非常痛苦的过程。作者说,如果你希望在离婚当中不要有那么大的伤害,就各让一步。那具体应该怎么解决呢?
1、破除囚徒困境
第一步是找到方式达成协议;第二步,找到方式让对方不变卦。比如,一开始大家约定好都不招,这就是一个协议;但后来有人变卦,你就受不了了。所以要用博弈论的方法来解决这个问题。
2、达成合作
让对方不变卦有三个途径:
第一,改变态度。就是我们在博弈的时候不要有那种 “不蒸馒头争口气”这样的想法,如果你能够稍微成熟一点,能够把效用范围变得更宽泛一点,可能更容易达成协议。
第二,诉诸善意的权威人士。就是找一个比较有权威,大家都听他话的人,比如有的家族有族长,那就请族长来进行辩论,听老人家的话,告诉大家应该怎么做。这个叫诉诸善意的权威人士。
第三,制定能够自行运作的策略。就是设置一套能够自行运作的机制,不需要整天由长老出面来解决问题,这个是博弈论的重点。因为前两个其实都是教育工作,涉及的都是你的态度,你要信任。最后一个是不需要教育工作,你照着做就行了。
交通规则就是一套典型的自行运转的机制。很多地方不需要警察,只要有摄像头,交通就能顺畅地运行。所以重点就在于我们怎么样去打造出能够自行运作的策略来。要解决囚徒困境,就要解决公平和正义的问题。
02、如何公平分配
人们对于公平和正义的需求,是一个天然的感受,甚至黑猩猩都能这样。动物学家研究黑猩猩,给它们分香蕉,他故意地给一些黑猩猩分得少,给这个两三个,给那个就分一个。竟然有的黑猩猩把那个香蕉摔了不吃,它生气了。我们以为说只有人才会在意公平,其实猩猩也在意。所以人们对于公平和公正的需求,是一个底层的动物性的需求。
1、我切你选
“我切你选”策略在什么情况下有效?著名数学家、计算机的始祖冯·诺依曼讲过,只有在零和博弈中有效。零和博弈表示所有博弈方的利益之和为零或一个常数,即一方有收入,其他方必有所失。在零和博弈中,博弈各方是不合作的。比如,家里分财产,我不可能通过分财产这件事创造出更多价值来,要么我多,要么你多。这叫零和博弈。
在国际社会上,如果你是零和博弈的思想,那就是看谁强大,然后讨论怎么分。但假如你能够通过建设、通过获取更大的收益来解决,这时候“我切你分”这个方法,就未必见得有效了。
比如,有一次作者去晚宴上吃饭,最后一道是甜点,轮到他这儿的时候只剩两块蛋糕了,一块大一块小。他后边还有一位女士,然后他就展现绅士风度,把蛋糕交给那个女士,说您先选。他想观察一下这个女士会选哪块。结果她毫不犹豫地选了小的那一块。他就觉得很奇怪,难道博弈论不存在了?他就问:您为什么选小的这块呢?女士说:“我觉得选大的有点不好意思。”这是什么呢?这是效用问题。
什么是效用?比如对于一个正在减肥当中的女士,或者一个要显示绅士风度的男士来讲,别人怎么看你、对你有什么样的印象,这些可能比吃到多大的蛋糕更重要。所以尽管她的选法跟其他的案例当中的假设都不一样,但是博弈论依然存在。因为它的效用变了,这个美好的感受也成为了效用的一部分,因此那个女士依然是自私的。
2、有争议的部分平分法
那如果遇到更复杂的情况,通过简单的“分蛋糕”不能解决了,应该怎么办呢?那就是运用有争议的部分平分法。什么叫作有争议的部分平分法?
比如,大房和二房要分财产,大房坚持认为说我要分全部的财产;二房认为我至少应该分到这财产的一半。那么请问,根据我们古老的智慧,她俩应该各分多少?答案是不用算,大房75%,二房25%。你说这是为什么?过程很简单,首先看哪些是有争议的部分。有争议的部分是一半,因为二房主张只要一半;另外一半是没争议的。没争议的先分给大房,剩下的一人一半,所以大房75%,二房25%。人类历史上大量分割问题的解决,都来自于这个公式。
3、调整赢家法
调整赢家法的基本原理就在于:对于同一项资产,不同的人可能会定出不同的价值,假如双方要划分所有权,就可以动些手脚,让双方感觉自己都拿到超过一半的所有权,达到双赢的局面。而且不管是什么情境都能够适用,这个叫调整赢家法,双赢。双赢局面是怎么产生的呢?是来自于大脑当中的幻觉。
03、如何突破困境
那我们如何让一个策略能够自行运作呢?作者说,我们要解决这些困境,让策略自行运作,最经典的做法就是石头剪刀布。
1、石头、剪刀、布
石头剪刀布在美国叫Ro-Sham-Bo,翻译过来就是罗尚博。罗尚博是法国和英国打仗时的法国元帅。那为什么用法国元帅的名字来命名石头剪刀布呢?英国跟法国在美国打完了仗以后,双方要签订和平协议,双方主帅要走进帐篷里边签和平协议。但是谁先进?这是个问题。我尊敬你,你先进;我不尊敬你,我先进。谁都不尊重谁,怎么办?双方开始猜拳,用石头剪刀布的方式解决了这个问题。所以后来大家就讨论说,很有可能提出这个建议的人,就是法国的主帅罗尚博,于是美国就把石头剪刀布叫作罗尚博。
石头剪刀布之所以有效,其实是自然界的规律。它有它的科学性存在,而且有随机性。很多案例都是通过它来解决,猜拳是最简单的方法。
比如,一个日本人要拍卖一幅画,苏富比和佳士得都想要。怎么选呢?双方提了好多提案,竞争的能力不相上下,这个老板就很苦恼。他女儿在旁边出主意,说让他们石头、剪刀、布吧,最后解决了。
2、通过沟通协商来建立联盟
通过沟通协商来建立联盟,才是解决博弈问题的最本质的东西。只有我们真的相互信任,所有的困境就都能解决。前提是真的信任,真的形成了联盟。
比如,鲱鱼,这种鱼类沟通的方式是放屁。它在水里放屁是有节奏的,通过这个节奏,它们之间达成一致,知道往哪儿游,知道什么地方有食物,哪儿有危险。他说连一个鲱鱼都知道要放屁来解决沟通问题。蜜蜂通过跳8字舞的路线来代表它的发现,这是蜜蜂的语言。
人类最朴素的沟通方法,或者说给我们带来了很多伤害的沟通方法,就是威胁和奖励。作者说有一次他在印度买东西,他说印度人把威胁和奖励用到了极致。他买衣服,八十块钱。他们就很老实,给人一百,给了以后就发现不找钱。他也不跟你吵架,他说你再挑二十的。他们俩觉得太窝火了,然后这两个英国人就学会了,假如对方说这衣服八十,那就给五十。对方说还差三十,不给了,你如果不愿意卖,把五十还给我,我就走。最后他们发现这招经常会管用,这就是用威胁和奖励来解决问题。当然要建立起联盟,关键就在于信任。如果你能够产生信任,问题就得到了解决。
比如,作者小时候过圣诞节,祖父母给他和弟弟送礼物,结果打开箱子发现送反了。然后说那你们俩换一下不就行了吗?但是他们之间没有信任呀,所以导致双方都不撒手,哥哥也不撒手,弟弟也不撒手。我给了你,你万一不给我怎么办?所以双方陷入僵局,拿着对方的礼物又不想要,又不愿意给对方。怎么解决呢?这时候爸爸站出来做了一个可信的人,爸爸说你俩如果都不撒手,这两个礼物谁都不给。他俩一听,相信爸爸,撒手就交换。
一旦有了信任,你就会发现这个联盟很容易建立。假如他们两个人不合作,两个人都要有巨大的损失。这就是在博弈当中引入第三方的好处,一旦第三方引入,联盟的关系发生了改变,问题就解决了,这个叫通过协商来建立联盟的过程。
如果能够形成这样一个联盟,最终达成的解决方案就叫帕累托最优。帕累托最优就是最省力也最有效率的一种状态,处于帕累特最优当中的这几个博弈方,没有人有动力去改变目前的博弈结果,这就形成了一个短暂的帕累特最优。大家都能够沿着这个方式,沿着一套规矩去做。当然如果外部的条件在发生改变、在引入新的博弈方,格局就会发生改变。
3、建立有效的信任机制
怎么才能够让博弈双方产生可信的承诺呢?第一,叫反悔的代价极高。比如,我们大家在一起二十年的朋友了,我们都是校友,都从一个学校里边出来的,我们共同认识的人至少有两百多个,这时候你骗我,成本高不高?你骗了我以后,虽然没有抵押,但是我只要把这个事说出来,你所有人脉关系全都没有了。这就是为什么在生活当中容易相信熟人的原因,他的成本代价更大。
但是你也还是要小心,我也见过一个人把自己几十个亿的财产托付给一个人打理,最后那个人卷钱跑了。就是他衡量了一下,我损失了所有的声誉,但是我也够了,几十亿呀。所以你要想,这两个要均衡。
其次,令对方无法改变心意。比如,德川家康获得日本政权以后,他让大名都到东京来建房子,把所有的大名的财产全部都搞到了东京,让你根本没钱造反,只要有钱就让你造房子,把东京非常快地发展起来。而且你也得给我生活在眼皮子底下,你如果造反,我先要你的命。他很善于用这个“无法改变的心意”来解决问题。
然后还有就是使用仪式,比如古人喜欢歃血为盟。还有就是直接信任,这效用很大。就是你先付出,你直接做出信任的表率。作者认为,能够信任别人的人,愿意吃点亏的人,不那么斤斤计较的人,在博弈的过程当中往往能够获得一个更好的结果。当然,不是一味地傻。
有人曾经用计算机做博弈的研究,分析什么样的回报策略能够给你带来最大的收益。结论是“以直报怨,以德报德”。什么叫以直报怨呢?就是首先是推己及人,其次也要学会以牙还牙。我们每一个人首先要保证自己先做好人,我守信用。如果对方背叛,我就改变策略,我也背叛。博弈的有效方法就是不要心存嫉妒,不要想当第一个背叛的人。有恩报恩,有仇报仇,不要想耍小聪明,这就是合作的最有效方法。所以人要学会做一个有底线、有操守的好人,这个才是我们博弈当中能够获得最高收益的方向。