一个博弈论例子

推研的人比较闲,过着吃了睡睡了吃的幸福生活,可以看一些自己喜欢的闲书。最近我在看的是一本翻译版博弈论教材,每周二带着它去上马哲课和中国国情课(可怜的胡鞍钢,偌大的教室就没几个认真听课的)。这本书最吸引人的地方就在于没有长篇大论的枯燥说明,而是用一个接一个的例子来说明博弈论的基本思想,很值得国内的教材学习。

活学活用,我也来举一个Friends里的例子,说明社会两难问题的博弈解。
话说Ross和Rachel是一对情侣,暗地里都有过不忠的行为。但他们并不想分开,而是希望能继续生活在一起,于是不得不面对一个问题:是否应该向对方坦白自己的不忠行为?对于Ross来说,他有两个战略,“坦白”或者“隐瞒”。如果他向Rachel坦白自己的过错,Rachel作为“清白”的一方(Ross并不知道Rachel的不忠行为,当Rachel选择“隐瞒”)将在二人关系中占据心理优势,从而使得Ross处于弱势状态。如果他决定隐瞒,则将背负良心上的谴责。这个博弈是对称的,因此对于Rachel来说同样存在这样的两难抉择。
我们引入经济学的收益概念来衡量博弈中战略的优劣,设收益上限为10分。如果Rachel选择“隐瞒”而Ross选择“坦白”的话,Rachel将占据“我是清白的”的心理优势,从而获得9的收益,而劣势一方的Ross的收益只有5。反过来对Ross来说也是一样。如果两人都不约而同地选择“坦白”,虽然彼此都会感到被背叛的痛苦,但是能够将心比己地互相原谅,二人的收益都是8。如果两人都选择“隐瞒”,他们之间感情得以维系的信任基础已经在事实上消失了,对双方来说都是非常大的损失,收益都只有6。下表列出了四种情况下双方的收益,Rachel在前。

Ross
坦白
隐瞒
Rachel
坦白
8 , 8
5 , 9
隐瞒
9 , 5
6 , 6

直观地说,肥皂剧观众和经济学家们最愿意看到的结果自然是双方都坦承错误并互相原谅,这样可以使这部肥皂剧更加吸引人并且使双方收益之和最大。但博弈论给出的结论却正好相反。
从表中可以看出,在Rachel选择“坦白”的情况下,Ross选择“隐瞒”的收益大于选择“坦白”的收益;在Rachel选择“隐瞒”的情况下,Ross选择“隐瞒”的收益也大于选择“坦白”的收益。因此,“隐瞒”对于Ross来说是一个占优战略,无论对方做出什么选择,这个战略都可以保证他的收益最大。作为一个理性的人(这是博弈论的基本假设),Ross必然会选择“隐瞒”。同样,Rachel也会选择“隐瞒”。于是,博弈的结果就是双方都选择“隐瞒”,各得到6收益。这是个稳定的纳什均衡,虽然结果出乎意料:博弈双方都选择了使自己利益最大化的战略,却得到了最差的收益(总收益是四种方案中最低的)。
而观众所期待的“彼此坦白”的情况下,任何一方都可以通过改变策略而获得更大的收益,比如Ross由“坦白”转向“隐瞒”可以使自己的收益由8上升到9。因此它是一个不稳定解,必须依靠某种外界约束才能存在。我们设想Ross和Rachel之间达成某种形式的协议,承诺对对方的不忠行为既往不咎。在这个约束条件下“彼此坦白”的解能够稳定存在,这就是合作解。

这是个典型的社会两难问题。各自从自身利益出发的博弈双方会自然而然地达到稳定的纳什均衡,但这往往导致最坏的收益。如果双方能建立有约束力的协议,则可以形成合作解,从而获得最好的收益。

14 thoughts on “一个博弈论例子”

  1. 蜗牛分析的很不错哦,赞赞赞!个体理性不一定是集体理性。
    下次把期望值,方差或者效用函数加进来讨论含有不确定性的情形,那就更有意思了哦:)

  2. 我觉得有点问题哦,一方坦白一方隐瞒的话,坦白的一方丢下了包袱获得了原谅收益应该是个9,至少是个8,隐瞒的一方应该觉得自己和对方做了同样的事但是对方勇敢坦白自己却昧了良心,收益也许5都不到
    不知道这是道德问题还是博弈问题

  3. 胡鞍钢讲课都没人听。。。清大的学生真是太幸福了。。。
    差不多布什、布莱尔之流也是来给咱上外教课的吧~

    1. 胡鞍钢名声很大,但讲课水平确实一般,反正我是提不起兴趣的。其实很多研究大牛讲课水平都不怎样,当年朱自清在清华教散文,每堂课摇头晃脑地念几篇美文,沉醉地说“嗯,真好真好”然后就下课了,学生都面面相觑不知所云

Leave a Reply

Your email address will not be published. Required fields are marked *

使用新浪微博登陆