走出“囚徒困境”的迷宫
王波是一个球迷。所在城市郊区有个足球场,有一次足球场举行一个重要的比赛,王波想去看。到足球场有好几条路,其中有一条是最近的。王波选择了走最近的这条路,但发现其他人也都选择走这条路,于是这条路非常堵塞。在路上所花的时间远远多于自己的预期。
好不容易来到了足球场,精彩的比赛让人大开眼界,可惜前排有人站起来,影响了自己的观看效果。王波也选择站起来,这样他能看的清晰一些,但他后排的人也都选择站起来看。最后的结果使所有人都在站着看比赛。
王波无疑是个理性的经济人,但是大家都是理性经济人的时候,便会不断出现“理性合成谬误”的状况。同样的道理,如果人人都是理性经济人,从个体来看所做出的选择或决策无疑是理性的,但人人都基于同样的考虑做出相同的选择或决策时,就会发生“理性合成谬误”。案例中造成路上拥堵、站立观看比赛的原因就是“理性合成谬误”。经济学中有名的囚徒困境更是典型的“理性合成谬误”。
警方在一宗盗窃杀人案的侦破过程中,抓到两个犯罪嫌疑人。警方将两人隔离,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人中有一人认罪,则坦白者立即释放而另一人将判8年徒刑;如果两人都坦白认罪,则他们将被各判5年监禁;当然若两人都拒不认罪,因警察手上缺乏证据,则他们会被处以较轻的偷盗罪各判1年徒刑。
那么,两个罪犯会怎样选择?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;即使他们能交谈,也未必能够尽信对方不会反口。
那么在困境中任何一名理性囚徒都会做出如此选择:
若对方选择抵赖,自己选择背叛,会让自己获释,所以会选择背叛。
若对方选择背叛,自己也要背叛,才能得到较低的刑期,所以还是选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。
囚徒困境
囚徒甲囚徒乙 坦白 抵赖
坦白 -5,-5 -8,0
抵赖 0,-8 -1,-1
囚徒困境反映个人最佳选择并非团体最佳选择。囚徒困境假定每个参与者都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
根据以上假设,两人均为理性个人,且只追求个人利益,选择背叛是个人的最佳选择。但以集体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑5年的情况好。
这种困境反映了个人理性与集体理性和之间的矛盾,对每个人而言都是理性的选择,能得到最优的结果,但对于整个集体来说却是非理性的,最终导致对集体中每个人都不利的结果。
每个人想到的都首先是自己的利益,进行的都是有利于自己的选择决策,但最后的结果,往往都没有使自己获利,大家都没有从中获得好处。以一个足球队而言,当球员在赛场所想的只是自己的风采,或是自己的位置,或者是在俱乐部的前途的时候,这支球队就不会有希望了。
为避免“理性合成谬误”,任何一个集体都应该加强内部协作。不仅每个人要充当理性的经济人,集体也应该成为理性的经济人,只有这样,才能实现集体和内部成员利益的最大化。
让他三尺又何妨
博弈论中有个著名的模型,即斗鸡博弈,又称为懦夫博弈。斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。我们简单认识一下斗鸡博弈。
两只实力相当的斗鸡狭路相逢,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果斗鸡甲退下来,而斗鸡乙没有退下来,那么乙获得胜利,甲就很丢面子;如果对方也退下来,双方则打个平手;如果甲没退下来,而乙退下来,甲则胜利,乙则失败;如果两者都前进,则两败俱伤。
因此,对每个人来说,最好的结果是,对方退下来,而自己不退。但是这种追求可能导致两败俱伤。
斗鸡博弈的收益矩阵
甲乙 前进 后退
前进 -2/-2 1/-1
后退 -1/1 -1/-1
上表中的数字的意思是:两者如果均选择前进,结果是两败俱伤,两者均获得-2的支付;如果一方前进,另外一方后退,前进者获得1的支付,赢得了面子,而后退者获得-1的支付,输掉了面子,但没有两者均前进受到的损失大;两者均后退,两者均输掉了面子,获得-1的支付。
斗鸡博弈有两个纯策略纳什均衡:一方前进,另一方后退;一方后退,另一方前进。但关键是谁进谁退?在现实中,哪一只斗鸡前进,哪一只斗鸡后退,要进行实力的比较,谁稍微强大,谁就有可能得到更多的前进机会,但前进的代价依旧是“两败俱伤”的结局。一旦进入骑虎难下的博弈,尽早退出是明智之举。有时候,双方都明白二者相争必有损伤,但往往又过于自负,觉得自己会取得胜利,这就是所谓“当局者迷,旁观者清”。斗鸡博弈往往最后得到的是一种“驴子式的胜利”。
伊索寓言中有一个“驴子和驴夫”的故事。驴夫赶着驴子路,但驴子逐渐偏离平坦的大道,沿着陡峭的山路走去。当驴子靠近悬崖边时,驴夫抓住驴子的尾巴,想把它拉回来。可驴子拼命挣扎,驴夫抓不住,驴子从山崖上滑下去了。驴夫无可奈何地说:“你胜利了!”
如果凡事都要决出输赢胜负,那么必然会给自己带来不必要的损失。只有一方先撤退,才能使双方获利。特别是占据优势的一方,如果具有这种以退求进的智慧,提供给对方回旋的余地,就会给自己带来胜利,而且双方都会成为利益的获得者。
清康熙时,文华殿大学士兼礼部尚书张英在京为官。在他老家桐城,他的邻居吴氏是当地的豪绅大户,欲侵占张府的宅地,家人驰书京城,要张英凭官威压一压吴氏气焰。谁知张英却回诗一首:“一纸书来只为墙,让他三尺又何妨。长城万里今犹在,不见当年秦始皇。”意思很明白:退让。家人得诗,主动退让三尺。吴氏闻之,也后撤三尺,于是形成了六尺宽的巷道,这就是“六尺巷”的由来。1958年,毛泽东接见前苏联驻华大使尤金时,曾引用过此诗,意在说明不与人计较斤两得失,大度处之。
由此可见,懂得退让并不是一种懦弱和失败,而是一种智慧。我们在工作和生活中要知道进退的道理,不要等到斗得两败俱伤的时候灰溜溜的败下阵来!
不可不知的共同知识
共同知识的概念最初由逻辑学家李维斯提出的。对一个事件来说,如果所有博弈当事人对该事件都有了解,并且所有当事人都知道其他当事人也知道这一事件,那么该事件就是共同知识。
由“共同知识”我们可以引出“脏脸博弈”模型:三个学生的脸都是脏的,但是他们各自都看不到自己的脸。老师对他们说,你们中至少有一个人的脸是脏的,请脏脸的学生举手。三个学生对视一番后无人举手,随即又都举手表明自己的脸是脏的。这是为什么?
我们可以还原一下他们的判断过程:
1)三个学生对视后,都看到了另外两个人的脸是脏的,满足“至少一个脏脸”的判断,因此无人举手。
2)既然“至少两个脏脸”,从任何一个人的角度而言,他已经看到了两个脏脸,他仍然可以不举手。
3)三个人都还是不举手,意味着三个人看到的都是两个脏脸,即所有人都是脏脸。因此,所有人都举手了。
这就是共同知识的作用:由老师的“至少有一个人的脸是脏的”就可推导出自己的脸是脏的。我们还可以用下面的这个故事来进一步解读基于共同知识下的脏脸博弈。
村里有100对夫妻,并有一些奇特的风俗:每天晚上,男人们都要谈论自己的妻子。如果男人相信自己的妻子忠贞的,他就当众赞扬她的美德。如果他发现他妻子不贞了,他就会企求神灵严厉地惩罚她。如果一个妻子曾有不贞,那她和她的情人会立即告知村里除她丈夫之外所有的已婚男人。
事实上,每个妻子都已对丈夫不忠,但是每晚每个男人都赞美自己的妻子。有一天来了一位传教士,他提醒说:“已经有一个妻子不贞了。”此后,丈夫们继续赞美各自的妻子,但在第100个晚上,他们全都企求神灵严惩自己的妻子。
应该说,传教士对“至少有一个妻子不贞了”这个事实的宣布,似乎并没有增加这些男人对村里女人不忠行为的知识,他们其实都知道这个事实。但为什么100天后他们都伤心欲绝呢?根源还在于共同知识的作用。
这是一个有趣的推理过程:当传教士说“至少有一个妻子不贞了”,由此并不能必然推出这个“不贞”的女人是自己的妻子,因为他知道还有99个女人对自己的丈夫不忠。而当第100天的时候,如果还没有人恸哭,那表明所有的女人都忠于自己的丈夫,而这显然与“至少有一个妻子不贞”的事实相悖。于是,每个男人都可确定地推理出来自己的妻子已经红杏出墙。传教士的宣布使得村子里的男人的知识结构发生了变化,本来“至少一个妻子不贞了”对每个男人都是知识,但却不是共同知识。
事实上在生活交际中,共同知识起着一种不可或缺的作用,只不过多数时候我们并没有留心而已。举一个简单的例子。小王决定做一个体检,在经历抽血、B超等多方位检查后,发现有一项“屈光不正”需要去眼科诊疗。花了8元钱的挂号费后,根据指引去做光学检验,但仔细一看,原来就是配眼镜的地方。原来,“屈光不正”就是近视眼!“屈光不正”是医学工作者的共同知识,但小王却并不清楚这样的知识,以至让自己多花冤枉钱。
由此可以看出,没有共同知识的博弈,会给整个社会无端增加许多交易成本。比如你去买菜,肯定知道猪肉比白菜贵,不过这是最浅显的“共同知识”。其实,这类知识无处不在。对于我们而言,多掌握一些“共同知识”,我们在博弈的生活中总会处于有利的地位。
置身事外的艺术
《史记·张仪列传》中有个“坐山观虎斗”的故事。
卞庄子发现两只老虎,准备刺杀。身旁的旅店仆人劝阻他说:“您看两只老虎, 正在吃同一头牛,一定会因为肉味甘美而互相搏斗起来。两虎相斗,大者必伤,小者必死。到那时候,您跟在受伤老虎的后面刺杀伤虎,就能一举得到刺杀两头老虎的美名。”卞庄子觉得仆人说得很有道理,便站立在一旁。
过了一会儿,两只老虎果然为了争肉撕咬扭打起来,小虎被咬死,大虎也受了伤。卞庄子挥剑跟在受伤老虎的后面刺杀伤虎,果然不费吹灰之力,就刺死伤虎,一举获得两虎。
卞庄子的策略就是“坐山观虎斗”,最终获得了自己所希望的结果。如果面对不止一个对手的时候,切不可操之过急,免得反而促成他们联手对付你,这时最正确的方法是静止不动,等待适当时机再出击。在博弈论中,有专门的一个模型是与此相关的,这就是枪手博弈模型。
彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。我们来推断一下:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?
一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。我们来分析一下各个枪手的策略。枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。
通过概率分析,发现枪法最差的丙存活的几率最大,枪法好于丙的甲和乙的存活几率远低于丙的存活几率。由此可以看出,在多人博弈中常常由于复杂关系的存在,而导致出人意料的结局。一位参与者最后能否胜出,不仅仅取决于自己的实力,更取决于实力对比关系以及各方的策略。