第七篇 第二章 从囚徒困境中突围 (1)
为什么聪明的囚犯,无法得到最好的结果
在博弈论的所有案例和模型中,囚徒困境无疑是最著名的。1950年,数学家塔克在担任斯坦福大学客座教授期间,给一些心理学家作演讲时,用两个囚犯的故事,将当时专家们正研究的一类博弈论问题做了形象化的解释。从此以后,类似的博弈问题便有了一个专门的名称——“囚徒困境”。“囚徒困境”在经济学、伦理学、社会学、政治学、哲学乃至生物学等学科中,获得了极为广泛的应用。
由于应用广泛,“囚徒困境”的版本很多,不断完善,现在普遍使用的“囚徒困境”大致是这样的:
甲、乙两个人一起持枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪各判10年。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他相信他的同伙会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。所以A犯唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙保持沉默,那么他就是那个带着奖赏出狱的幸运者。如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯都坐牢。
为什么聪明的囚犯,无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。
囚徒困境为我们探讨合作是怎样形成的,提供了形象的解说方式,产生不良结局的原因是因为囚犯二人都基于自私的角度考虑问题,最终导致合作没有产生。
囚徒困境确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,囚徒困境给我们带来的也并不全是坏消息。
当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒困境的确体现出了人际交往中不信任和需要相互防范背叛的一面。
囚徒困境是一些非常普遍而有趣的情形的简单抽象,可以说是理性的人类社会活动最形象的比喻。它准确地抓住了人性的不信任和需要相互防范这种真实的一面。从个体的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果。当你身处类似“囚徒困境”这样的同时行动的博弈中,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择往往是有迹可循的,并形成某种“定式”,即均衡。
合作还是对抗
先看一个关于拍卖的游戏。
游戏中一张一美元纸币被当众拍卖,规则有两条:
第一条,同任何拍卖一样,钞票归价格最高者所有,新的报价必须高于上一次报价,直到规定时间内没有新的报价结束。
第二条,报出第二高价者也要付出他最后一次报价的款项,但什么都得不到。
这个游戏最后会演变成什么样子呢?如果是你,你会怎么做?
这个问题暂且不谈,让我们看看博弈专家们是怎么博弈的吧!他们是合作还是对抗呢?
在美国召开了一次囚徒困境研讨会,与会者都是博弈论的专家。会议的一个重要议题就是玩一个游戏。
他们拿出一个大信封,请在场的43位专家学者拿出不限量的钱装到这个信封里。规则是:如果到最后这个信封里的钱超过250美元,大会的两位主持人将自己掏腰包,退还每人10美元。不过,如果最后信封内的钱不足250美元,就统统没收,大家拿不到一分钱。仔细想一想,如果你也在场,你会奉献多少钱呢?
让我们来简单地计算一下每个人应该要放入的数目:250÷43=5.81。如果为了防止一些小气鬼少付或不付,你也可以再多加一点。如果每人放进去6美元,应该就可以超过250美元了。等到最后退还10美元时,每人还可以净赚4美元呢!
无论怎样,这看来都是一个稳赚的买卖。
不过,这个游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。
最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是245.59美元,比目标250美元就差那么一点点。
你有没有料到会有这样的结果?其实这个结果一点都不意外——要说意外的话,反倒是信封里居然还有那么多钱。
不要忘了,参加游戏的都是博弈论专家,他们每个人都是熟知囚徒困境的。他们明白每一个参与者的优势策略都是“不合作”——一分钱也不放,而能得到的结果也是大家一分不得。所以一些人不往信封里放钱,只是遵循一个优势策略。相反,如果信封里的钱超过了250美元将是一个意外,而且这些专家们也许会觉得更尴尬:他们用自己的行动,证明了自己借以安身立命的学说(博弈论)的破产。
但是毕竟信封里还有那么多钱,人并不总是像经济学假定的那样“理性”,而是各有偏好的。有些人仁爱宽厚,有些人顾及面子,有些人漫不经心——比如那个0.59美元的零头,就不大可能出自某些人的细心计算,更可能是某些人把口袋里的几个零钱随意处置造成的,还有些人尽管知道这个游戏最可能出现的结果,但还是希望试试“合作”是否会出现……
如果非要就这个游戏给这些专家下一个评语的话,恐怕我们得说:不那么处处算计的人还是很多的。这个事例说明了个人在作利益选择时,遵循的并不完全是一次性原则,这很可能是由我们的生活经验和受到的教育决定的。再回到前面的拍卖博弈,有什么样的结论你应该有答案了,如果不信,你也可以试试。但无论如何,在一个困境中,作为个体如何作出对己有利的选择,充分利用智慧来取得共赢,这是个重要问题。
职场上的囚徒困境
企业为促使员工互相竞争,有时候会在员工之间刻意形成囚徒困境的局面,以刺激他们的表现。为了形成囚徒困境,上司宣布表现最优秀的员工会得到奖励,表现最差的员工则会被炒鱿鱼。员工接受了这场博弈,他们可能会兢兢业业。
但是,如果一个企业是以相对的标准来评估个人的表现,情况会变成什么样子呢?结果很可能是他们集体偷懒,因为每个人都偷懒时,大家的表现就会不相上下。当然,所有的员工都会失去成为先进的机会,但放弃这个机会来换取安逸的工作环境也许很值得。假如有员工真的想要背叛大家而长时间工作,其他员工就可以排挤他,以惩罚这个不偷懒的背叛者。因此,只要员工在一起工作,而且彼此之间形成了重复博弈,他们就可以享受安逸。在重复博弈中,只要员工合作,而且能有效地找出并惩罚背叛者,相对标准所形成的囚徒困境自然就会瓦解。