第八章 人人都想好,为何结果都不好——囚徒困境
人人都想好,为何结果都不好——囚徒困境
这既是一个耐人寻味的小故事,又是一个经典的经济学悖论。
警察抓获了两个重要的嫌疑犯,却只掌握了很少的证据,如果就此量刑,嫌疑犯将只受到很轻的惩罚。所以,警察就动用了这样一个办法,将两人隔离,然后分别对每个人说:
1.如果你认罪,而你的同伙沉默,那么他将被判10年监禁,而你将马上获得自由;
2.反过来,如果你的同伙认罪,而你保持沉默,那你将被判1O年,他将自由;
3.如果你们两个人都认罪,每人都将被判5年监禁;
4.如果你们两个人都沉默,你们每个人只会坐1年牢(因为警察证据不足)。
稍加分析,我们会发现,每个嫌疑犯可能面临的监禁分别是10年、5年、1年和0年。从他们的角度来说,当然希望避开10年的漫漫铁窗生涯,从而马上自由。但是,问题的关键就在这里:每个人最终的刑期并不是由他自己决定的,而是两个人一起作出选择后的结果,即需要两人共同来达成。读者如果有兴趣的话,可以设身处地,将自己置于嫌疑犯的角度去考虑,就会发现其中有许多奥妙,甚至还能体会到有关人性的问题。
当然,经济学家更关心的是其中蕴藏的博弈论原理。一般的经济学理论认为,市场中的每一个个体都希望自己的利益最大化。不过,做生意的人都不是傻子,你希望利益最大化,我也肯定如此。假设我是其中的A嫌疑犯,当然希望自己坦白从宽,而B抗拒从严,可是多年的社会经验告诉我,B肯定也会这么想。退而求其次,只坐1年监禁也不错,前提是两个人都得沉默,但是那样做我将冒极大的风险(因为B可能会招供)。思来想去,决定自己还是招供,这样避开了10年牢狱,最多也就是坐5年,而对双方都有利的1年刑期就不作指望了。
两人共坐五年牢的结果,在博弈论中被称为纳什均衡。它的定义如下:
假设N个局中人参与博弈,在给定其他人策略的条件下,每个人都会选择自己的最优策略,从而使自己效用最大化,这样所有人的策略就构成一个策略组合。纳什均衡由所有参与人的最优策略组成,并且在给定其他人策略的情况下,没有人有足够的理由来打破这种均衡。在囚徒困境中,两名嫌疑犯都希望自己的利益最大化,并且都知道对方将要采取的策略(其他人策略已经给定),结果产生了一种纳什均衡,而任何一名嫌疑犯都无力将其打破。需要指出的是,将囚徒困境作为重要课题之一的博弈论几乎彻底改变了人们对市场和竞争的看法。在这里要提一下纳什,作为一个天才的数学家,在经济博弈论领域,他提出的纳什均衡在非合作博弈理论中起着核心作用,到了今天,博弈论研究都以这一概念为基础。而作出划时代贡献的纳什,其克服精神分裂症,坚持研究的经历更是跌宕起伏,令人敬佩。
以旁观者的角度看,囚徒困境显然不是一个最佳的结果。然而,它竟然是符合西方经济学理论的。被誉为经济学圣人的亚当斯密在《国富论》中有句名言:一个人通过追求自身利益,常常会比他实际上想做的那样能更有效地促进社会利益。这究竟意味着什么呢?也就是说,在市场经济中,每一个人都从利己的目的出发,而最终全社会将达到利他的效果。通俗点说,就是人人都为自己好,社会就会变更好。但是上面的囚徒困境却对斯密提出了有力挑战:对两个嫌疑犯来说,在斯密精神的指导下完全为了自己好,结果却是大家都不好。最有利的1年监禁没有出现,两个囚徒损人而不利己,一个悖论就此出现——实际上,从某种意义上说,正是这个悖论动摇了西方经济学的基础。
我们已经知道,在囚徒困境中,如果两个嫌疑犯相互串供(经济