登陆注册
3253600000003

第3章 纳什均衡与最优策略

一、美丽心灵:纳什

1994年度的诺贝尔经济学奖获得者纳什的传奇经历耐人寻味。

纳什在1950年7月13日22岁生日那天获得数学哲学博士学位。而40多年以后获得诺贝尔经济学奖的主要缘由,就是他的博士学位论文。

1957年当纳什到普林斯顿高等研究院访问的时候与阿丽莎结婚,一年后纳什在麻省理工学院得到了终身职位,阿丽莎怀上了他们的孩子,也是在这个时候,美国著名的《财富》杂志把纳什评为美国最耀眼的科学新星。生活多么美好,多么甜蜜!却不料在纳什的学术生涯向巅峰攀升的大好年华,病魔袭击了他。

从1959年开始,偏执型精神分裂症使他几乎成为一个废人。上课时候,他会语无伦次,甚至做出很不像样的举动。讲演会上,他会说一些不连贯的、毫无意义的内容,因为实在无法继续工作,纳什辞去了在麻省理工学院的教职。纳什完全被病魔所控制,他热衷于给政治人物写一些奇怪的信,在欧洲悠悠荡荡差点被法国警察抓到精神病院。留在国内的妻子以及他的同事开始收到一些奇怪的明信片,充斥着莫名其妙的数字。他怀疑被跟踪、被刺杀,甚至一度要求放弃美国公民的身份。

最终,纳什夫妇分居了,后来正式离婚。纳什回到西弗吉尼亚州,和母亲住在一起。往后的30多年,纳什的时间是在故乡西维珍尼亚、精神病医院和普林斯顿度过的。

离婚以后,好心的阿丽莎还是让纳什像在普林斯顿的时候和她住在一起。她再也没有结婚,依靠自己作为电脑程序员的微薄收入和亲友的接济,照料前夫和他们的儿子。

阿丽莎坚持认为纳什应该住在普林斯顿:在别的地方如果你行为古怪,会被当做疯子,可是在普林斯顿这个有许多人获得过诺贝尔奖的地方,如果你行为古怪,人们会想你可能是一个天才。这里不仅有树林中的爱因斯坦小道,而且人们都知道爱因斯坦为邻居小女孩做算术题换取糖果的轶事。

普林斯顿的人们充满了爱心,但是却一度越来越相信曾经做出过如此深刻的科学发现的纳什,恐怕再也逃不出常常要被送进精神病院的命运。想不到,医生、亲人和普林斯顿的爱心,终于浇育出绚丽的花朵。我不想说那是奇迹。

大约在20世纪80年代,纳什的病情开始有了转机。他逐渐可以与人交谈,有时候还可以讨论一点儿问题。特别是,他终于跟上在他被精神分裂症折磨的30年里不断更新换代的计算机。

差不多就在这个时候,纳什曾经成为诺贝尔经济学奖候选人,但是最终没有成功。当时间走近1994年的时候,博弈论获奖的形势更加有利,是瓜熟蒂落的时候了。

纳什的故事还被好莱坞搬上了银幕——《美丽心灵》,并且获得许多奖项。感兴趣的读者可以看看这部感动心灵的好莱坞经典电影,通过电影可以对纳什有更感性的了解。

讲纳什的传奇人生经历,主要是为了讲解“纳什均衡”。

纳什均衡的意义在于,它是关于博弈结局的一致性预测,如果所有局中人预测一个特定的纳什均衡会出现,那么这种均衡就会出现,预测之间没有矛盾,不会因为有的局中人认为不符合自己的利益要求而失败。

只有纳什均衡才能使每个局中人均认可这种结局,而且他们均知道其他局中人也认可这种结局。而非纳什均衡的结局并非一致性预测,如果局中人预测会出现非纳什均衡,那么或者是局中人的预测相互不统一,或者是局中人在估计别人的策略选择或极大化自己的支付时犯了错误。

纳什均衡最重要的性质是“自我强制性”。如果局中人就纳什均衡结局达成协议,那么不需要任何外力的帮助,它自身就蕴含着保障实现的力量。

任何非纳什均衡的结局要成为协定都需要外在强制力量(道德、法律等)的帮助,否则有的局中人将会有动机背叛协定。

纳什均衡的弱点在于,它并不能保证唯一性,存在多个纳什均衡时哪一个会在现实中出现是一个难以解决的问题。另外,引入其他理性考虑后,有些纳什均衡并不那么合理。

在纳什均衡定义的基础上,可以进一步定义强纳什均衡,强纳什均衡是指每个局中人对于对手的策略有唯一的最佳反应,即为严格纳什均衡。

原则上,强纳什均衡是一个更具有说服力的均衡概念,它具有稳定性,即使支付中出现微小的扰动,强纳什均衡仍保持不变。

而且,由于局中人改变策略会使其利益受损,所以局中人有维持均衡策略的动力。而纳什均衡中可能有的局中人会认为均衡策略与其他策略之间是无差异的,所以并不能保证局中人一定会选择均衡策略。

纳什均衡的弱点是,即使在混合策略意义下也不能保证存在性,相当多的博弈局势中没有强纳什均衡。

二、情侣博弈

大海和丽娟正在热恋。难得的周末又到了,安排什么节目好呢?

周末晚上,中国足球队要在世界杯外围赛中和伊朗队展开生死之战。大海是个超级球迷,国内的甲级联赛都不肯放过,何况是不争气的国家队的一场生死大战?也正好是这个周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧《胡桃夹子》!

这么说,一个在家里看电视直播的足球,一个去剧院看芭蕾舞演出不就得了?问题在于他们是热恋中的情侣,分开各自度过这难得的周末时光,才是最不乐意的事情。这样一来,他们就面临一场温情笼罩下的博弈:

在情侣博弈中,双方都没有严格优势策略和严格劣势策略。我们不妨这样给大海和丽娟的“满意程度”赋值:

如果大海看球让丽娟一个人去看芭蕾,双方的满意程度都为0;

两人一起看足球,大海的满意程度为2,丽娟的满意程度为1;

两人一起去看芭蕾,大海的满意程度为1,丽娟的满意程度为2.

应该不会有丽娟独自看球而大海独自去看芭蕾的可能,不过人们还是把它写出来,设想因此双方的满意程度都是0.

这样来描述大海和丽娟的情侣博弈,你觉得怎么样?

现在,芭蕾不是大海的劣势策略,因为如果丽娟坚持芭蕾,他选足球只得0,选芭蕾却还可得1.足球当然更不是大海的劣势策略。所以,大海没有全面的劣势策略。同样,丽娟也没有全面的劣势策略。这样,严格劣势策略消去法就没有用武之地了。

但是,他们总会做出一个较好的选择,因为他们是热恋中的情侣。

在情侣博弈中,双方都去看足球或者双方都去看芭蕾,就是我们所说的相对优势策略的组合:一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。准确地说,是单独改变不会带来额外的好处。

如果两人一起看足球,大海得2丽娟得1;

如果大海单独改变去看芭蕾,变成双方都得0,没有好处;

如果丽娟单独改变去看芭蕾,也变成双方都得0,也没有好处。

所以,两人一起看足球是稳定的结局。同样,两人一起去看芭蕾也是稳定的结局。

什么是纳什均衡呢?简单说就是,在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他单独改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。

需要强调的是:均衡不一定是博弈的最优结果。

在“囚徒困境”中,唯一的均衡是一起招认,站在群体的角度,这是最坏的结果。均衡只是博弈的最“稳定”结果,或者说是最可能出现的结果。

纳什均衡就是指,在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。

三、两只公鸡博弈

在一座独木桥上,北方王红鸡和南方王黑鸡相遇了。

红鸡傲慢地说:“快给我让路,否则我把你撞到河里喂鱼。”

黒鸡也不甘示弱地说:“还是你先给我让路,否则我把你撞到河里喂鱼。”

两只鸡谁也不肯服输,僵立在独木桥上等待对方让路。

几天几夜过去了,两只鸡仍僵立在独木桥上等待对方让路。

故事中每只公鸡有两个行动选择:一是退下来,一是进攻。

如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。

因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。

两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进的公鸡获得1的支付,赢得了面子,而后退的公鸡获得-1的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的支付。当然这些数字只是相对的值。

这个博弈有两个纳什均衡:一方前进,另一方后退。

但关键是谁进、谁退?

一个博弈,如果有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一个事先知道的唯一的博弈结果。

但是如果一个博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。

一个博弈,如果有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一个事先知道的唯一的博弈结果。

四、新闻大战

有两大杂志——《时代》和《新闻周刊》在进行激烈的竞争。每个星期,两大杂志都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会闭门举行会议,选择下一个封面故事标题。

假定本周有两个大新闻:一是国会就预算问题吵得不可开交,二是发布了一种据说对艾滋病有特效的新药。

编辑们选择封面新闻标题的时候,首先考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条封面新闻标题都会买这本杂志)。

在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣,这些人只会在自己感兴趣的新闻变成封面新闻标题的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面标题,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》。

现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面标题,那么,假如我采用预算问题,我就会得到整个‘预算问题市场’(即全体读者的30%);

“假如我采用艾滋病新药,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病新药为我带来的收入就会超过预算问题。

“假如《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者;假如我采用艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来更大的收入。

“因此,我有一个优势策略,就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我的其他策略更胜一筹。”

在这个博弈里,双方都有一个优势策略。以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。

虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。

不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。

假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办。

同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。

在你没有优势策略的情况下,你要做的就是剔除所有劣势策略,不予考虑。如此一步一步做下去。

假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。

假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。

即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈的复杂程度。

利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。

你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。

假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

五、把功劳让出去

明朝正德年间,朱宸濠起兵反抗朝廷。王阳明率兵征讨,一举擒获朱宸濠,建了大功。

当时受到正德皇帝宠信的江彬十分嫉妒王阳明的功绩,以为他夺走了自己大显身手的机会,于是,散布流言说:“最初王阳明和朱宸濠是同党。后来听说朝廷派兵征讨,才抓住朱宸濠以自我解脱。”江彬想嫁祸并抓住王阳明,作为自己的功劳。

在这种情况下,王阳明和张永商议道:“如果退让一步,把擒拿朱宸濠的功劳让出去,可以避免不必要的麻烦。假如坚持下去,不做妥协,那江彬等人就要狗急跳墙,做出伤天害理的勾当。”

为此,他将朱宸濠交给张永,使之重新报告皇帝:朱宸濠捉住了,是总督军门的功劳。这样,江彬等人便没有话说了。

王阳明称病休养到净慈寺。而张永回到朝廷,大力称颂王阳明的忠诚和让功避祸的高尚事迹。皇帝明白了事情的始末,免除了对王阳明的处罚。

王阳明以退让之术,避免了飞来的横祸。

王阳明让出名誉,保全自己的做法无疑是睿智的。

面对复杂多变的形势,人们不仅需要慷慨陈词,而且需要沉默不语;既需要穷追猛打,也需要以退为进;既应该争,也应该让。一句话,有为是必要的,有时候无为也是必要的。

然而,什么时候有为,什么时候应该无为呢?无为和有为的选择取决于主客敌我双方的力量对比。

当主体力量明显占优势,居高临下,采取行为以后,可以取得显著的效果时,应该有为。

而当主体处在劣势的位置上,稍一动作,就可能被对方“吃掉”,或者陷于更加被动的境地,那么,便应该以退为进,坚守“无为”方是。

无为只是一种权宜之计、人生手段,待时机成熟,成功条件来到,便可由无为转为有为,由守转为攻,这就是中国古人所说的屈伸之术。

当主体力量明显占优势,居高临下,采取行为以后,可以取得显著的效果时,应该有为。

六、价格大战

《时代》和《新闻周刊》两大杂志,每本杂志的制作成本是1美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为l美元)。

假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。

杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800万。

这时,你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果双方都是3美元,利润都是500万;一方降价至2美元,独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。

《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。

《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。

问题是比较这两个数字毫无意义。

500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如《时代》把价格降到2元,利润还会更高,达到800万美元。

假如你有一个优势策略,请照办。不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。

提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。

若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。

假设你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自己的优势策略。

正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。

但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。

某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。

在竞争对局下,假如你先行采取策略,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。

同类推荐
  • 趣味经济学

    趣味经济学

    本书旨在通过对大量精彩有趣的经济学事件的分析来达到实用为本的目的,让你在精彩有趣的经济学事件中轻松掌握经济学知识,参透理财技巧,明晰赚钱和成功法则。
  • 经济学的思维方式全集

    经济学的思维方式全集

    一部通俗易懂的老百姓经济学手边书。以讲事实、过日子的方式说事儿,在嬉笑怒骂中让艰涩难懂的经济知识变得通俗易懂,妙趣横生。为大家开启一扇个人理财、经济形势分析、经济政策解读的窗口,帮助那些也许对经济学知识不那么了解的P民“活明白”,不再给资本家、投机客、“砖家”当炮灰。
  • 动物界经济学

    动物界经济学

    从动物身上可以找到自己的本源,从经济学上找到指导我们的哲理。将五彩缤纷的动物世界与富含生活智慧的经济学原理相结合,并对人类的社会现状做系统分析,会让我们对自己正在面临的或即将面临的难题找到有效的解决方式。
  • 下一轮经济危机2:中国凭什么幸免于难

    下一轮经济危机2:中国凭什么幸免于难

    虽然人们将爆发的危机命名为美国次贷危机、美债危机、欧债危机,可为什么中国的经济同样那么艰难?如果说,中国经济下滑的重要原因在于外部环境的恶化,那为什么中国的股价下跌得比美国和欧洲的大部分国家都要严重呢?作者认为,这一轮经济危机的实质在于创新的停滞。创新停滞导致生产力增长乏力,社会支出大于社会产出,主权债务如雪球般越滚越大。而政府基于社会和经济稳定的诉求,在错误思想的指导下,释放流动性,制造通胀。“货币把戏只能收到表面的一时之效,从长远看它肯定会让国家陷入更深重的灾难。”政府对解决危机的一次次拖延,使危机积蓄力量,蓄势待发。
热门推荐
  • 极品神婆

    极品神婆

    没有太多费神的勾心斗角,没有太多烧脑的感情纠葛,有的是风水、开光、捉鬼、打僵尸。学校、黑帮、妖魔鬼怪,惹我?统统收了你们这群妖孽!
  • 爱情的三部曲

    爱情的三部曲

    爱情三部曲:《雾·雨·电》,作者所写的主要是人,是性格。他主要想用恋爱来表现一些人的性格。就如佩珠,她比前面的两个人进步多了。不过,《电》和《雨》不同,和《雾》更有差别。《电》的头绪很多,适合这个标题,的确像几股电光接连地在空中闪耀。短篇小说《雷》只是一个不小的插曲。故事发生的时间在《雨》和《电》之间。因为《电》里面的几个人物如慧、敏、明、碧、影都曾在《雷》里出现过,我现在就把《雷》放在《电》的前面。
  • 傻子王爷无情妃

    傻子王爷无情妃

    一只毒蝎子,彻底断送了她年轻的生命!别人只知道,那个软弱没主见的女人被迫嫁给一个痴傻呆闷的七皇子。殊不知,她早已不再是“她”!面对痴傻只会憨笑的美男,她气愤难填!你傻,本美女就医好你,谁知医好后,遭到嫌弃,却换来一纸休书,气愤之下,她恨不得与他同归于尽……
  • 奸商养成记

    奸商养成记

    什么叫寸土寸金?什么叫寸金难买寸土地?万丈高楼平地起,左看右看买不起。存折上几个零算什么,比不上房产证上一个名。原本欢欢喜喜去看房,谁知天上掉下一块天花板,吧唧一声,人穿了……人世间最悲哀的事是什么?答:房到手了,人却穿了……既然上帝给了我穿越的机会,我就用它来捣腾房、地、产!
  • 明星恋人:纯情妈童星宝

    明星恋人:纯情妈童星宝

    苏尔颜轻笑说:“我不管你是艾小鱼也好,言小艾也好,请你老实地告诉我驰道的爸爸是谁?”艾小鱼心生恼怒,嗤笑说:“这……跟你没关系。”
  • 死亡三叹

    死亡三叹

    陈集益,70后重要作家。曾就读于鲁迅文学院第七届中青年作家高级研讨班。浙江省作协签约作家。在《十月》《人民文学》《中国作家》《钟山》《天涯》等大型文学期刊发表小说六十万字。2009年获《十月》新锐人物奖。2010年获浙江省青年文学之星奖。
  • 生命的密码下(破解人类文明与科学之谜)

    生命的密码下(破解人类文明与科学之谜)

    宇宙茫茫,星空浩瀚。亿万年来,宇宙每天都在人类的面前,炫示着她的神奇与伟大,灿烂与深邃。
  • 掌上帝国之秦朝的变革

    掌上帝国之秦朝的变革

    坐看高富帅们尔虞我诈,利用矮矬穷们出谋献计,哪怕你年岁不在,只要有才,照样功高盖主,定会有你一片天地。最终渔翁得利者,才是笑到最后的霸主!
  • 东宫有本难念的经

    东宫有本难念的经

    宝庆十九年春,大佑国皇太子大婚,大将军之女入主东宫。一个不是淑女的将门千金遭遇一个不是文韬武略的中庸太子,到底是佳偶天成,还是冤家路窄?成婚一年不足,太子忽然休妻。迷影重重,生死茫茫,这样一来,还是不是大团圆结局?
  • 至尊庶女:腹黑杀手王妃

    至尊庶女:腹黑杀手王妃

    从地球穿越而来的史上最强女杀手,一朝穿越却成了南川国相府的妖孽四小姐,备受欺凌,却扮猪吃老虎的每次都将欺负自己的人欺负回去。新婚当日,竟被嫡姐与父亲算计,代替嫡姐嫁给靖江王当妾,收尽欺凌、筋脉尽断,一身修为皆数断送,可是却在机缘巧合之下得到神秘空间,于是开始了发家致富,斗渣姐、欺后爹、戏夫君、灭小妾的幸福生活