每天耕耘最有趣、最实用的心理学
生活处处皆博弈,囚徒困境带给我们的启示
关于博弈,很多人都知道也听说过。生活中处处有博弈。那么究竟什么是博弈呢?
博弈原意是指下棋,引申义则比较丰富多样:在一定的外在条件下,参加项目的人们共同遵守相同规则,选择并实施各自不同的行为或策略,并得到相应结果的过程。有时候,博弈也作为一个动词,表示一种动态的过程。
通常,一个完整的博弈会包括五个要素:
第一,参与者,它可以是博弈过程中独立决策并承担后果的个体或者组织;
第二,博弈信息,就是参加博弈者掌握的对策略有帮助的外界信息资料;
第三,策略集合;
第四,博弈次序,就是博弈参与者做策略选择的先后顺序;
第五,博弈收益,就是博弈方做出策略选择后的得与失。
此外,如果从博弈的具体应用来划分的话,还可将博弈分为静态博弈和动态博弈。
所谓静态博弈,就是指在博弈中,两个参与者同时做出选择,或者两人做选择的时间或者秩序不同。而且靠后的行动者,不知道先行动者会采取什么样的具体行动。
也就是说,在同一件事情的争论和推进中,参与双方都容易造成行为上的重组重复。
动态博弈则是指在博弈中,两个参与人的行动是有先后顺序的,而且,靠后的行动者可以观察到最先行动者所选择的是哪种行动和策略。
博弈在我们的生活中无处不在,而在博弈理论中有一个经典的例子,那就是囚徒困境。
【囚徒困境博弈论】
一个富翁被发现死在家中,一部分财物也被盗走。警方经过侦讯逮捕了强盗A和强盗B,但两人都矢口否认杀死过富翁,只承认入室盗窃偷东西的罪名。案件陷入困境,于是警方将两人隔离关押,由地方检察官分别与两个人进行一对一的谈话。
检察官对A说:偷盗罪证据确凿,所以一年刑期是肯定会有的。但是,我这里有一个交易,如果你承认杀人罪行,我就只判你三个月监禁,但你的同伙就要被判刑十年;现在如果你拒不坦白认罪而被你的同伙检举你的杀人罪行,你就会被判刑十年,而他则只判监禁三个月。另外,如果你们俩同时承认了杀人罪行,那么,你们就同时被判刑5年。
这就是著名的囚徒困境。
那么强盗A和强盗B该如何选择呢?
显然,他们只有两种选择:承认杀人或否认杀人。
旁观者清,似乎对于二人最好的选择策略是大家都不承认杀人罪行,然后都被判1年。但是,我们不要忘记,两人被分别关押,并且缺乏信任和了解,所以不会知道对方会做出什么样的选择。
根据经济学家亚当斯密的理论,任何人考虑策略都是从利己的角度去做选择的。所以,从对个人最为有利的角度讲,选择承认杀人才是个人的最佳策略。因为承认杀人后,只会被监禁3个月。很显然,这要比自己不承认杀人而坐10年牢好得多。
可是,这个策略能够实现的前提是,另一方抵赖。所以,承认自己杀人这种策略,其实是个损人利己的策略。
不仅如此,承认自己的杀人罪行还有其他好处。比如,如果对方坦白而自己抵赖,那自己就得坐牢10年。因此,在双方被隔离不能互通消息的情况下,最好的策略其实是两人同时坦白,这样两人至多分别只被判5年,总体也比被判10年好。
强盗A和强盗B最为合理的选择,是同时向检察官承认杀人罪行,这种两人都选择承认杀人罪行的策略,以及同时被判5年。
这样的博弈结果,我们称之为纳什均衡,而它的正式学术名称叫做非合作均衡。
这一囚徒困境选择,有着广泛而深刻的辐射意义。因为,当个体在选择策略时,如果没有共谋或者窜供,每一个人都会选择对自己最有利的策略,绝对不会考虑社会福祉,或其他对手的利益。
这就意味着,个人与集体之间虽然有冲突,但是个体追求利己行为,最终会导致的结局是一个纳什均衡,也是对所有人都有利的结局。
从纳什均衡中我们还可以悟出一个道理:合作,才是非常有利的利己策略。但是,合作必须符合一个黄金律:必须是双方都按照同样的方式行事才行。
男人、博弈、权力
了解了囚徒困境之后,我们再来说说男人与博弈,而男人博弈的核心就是权力。
在电影《教父》中,有一句台词是这样说的:女人和小孩能够粗心大意,但是男人不行。
90后新生代估计对男人的圣经《教父》不是很了解。但很多70后、80后都是它的忠实拥趸,因为它讲述的就是一个男人权力与实力的故事,堪称博弈经典。
权力与博弈,历来被看作男人的魅力与实力的最佳表现。
在《教父》这部电影中,呈现最多的就是合作与背叛。运用最多的也是博弈思维,并且影片还向所有人传达出一个最为有利的理论,那就是根据囚徒困境演绎而来的一个道理:永远不要与背叛过你的人合作。
在《博弈论》中,这也是一个著名的模型——重复囚徒博弈。
重复囚徒博弈规则是,在每一次单独博弈中,参与双方都只有两个选择:合作或者背叛。我们将AB双方的选择组合排列如下:
合作+合作合作+背叛背叛+合作背叛+背叛
在博弈中,如果A和B双方合作,就可以各拿3分;如果一方选择合作而另一方背叛,则背叛方将能拿到5分,选择合作的一方只能拿0分;如果双方都选择背叛,则各拿1分。
综上所述,AB双方的积分表排列如下:
1.A:合作得3分,B:合作得3分;2.A:合作得0分,B:背叛得5分;3.A:背叛得5分,B:合作得0分;4.A:背叛得1分,B:背叛得1分;
在此基础上,我们再来分析为什么选择背叛的人会一直得益。
用A来分析这个事实,如果A一直选择策略背叛,那么A必然会遇到以下两种情况:
① B合作,A背叛,A得5分。
② B背叛,A背叛,A拿1分。
可以看出两次得分中,选择背叛的A,每次都能拿3分。假设把A的策略变成合作,则A会遇见以下情况:
① B合作,A合作,A会得到3分。
② B背叛,A合作,A会得到0分。
两次得分统计中,A每次只能得1.5分。相比于A选择背叛策略时,他的得分明显减少。
所以如果一直这样比对下去,你会发现,如果人们一直选择背叛策略,那么人们会一直不吃亏。从这个理论上讲,平时选打破规则的人,的确会比一般人得到更多。而这种人,一般都是会背叛别人的人。
所以说,一旦你看清楚某个人的个人信誉有问题,就一定不要与他有任何合作,千万不要指望这个人会善心大发,或者回头是岸。
人性使然他绝无可能改变,选择背叛策略的人,只会一直背叛他人,让自己获益。
这样的人,也绝对不值得你给他第二次机会!
- The End -
作者 | 汤靡达
编辑 | 一粒米
第一心理主笔团 | 一群喜欢仰望星空的年轻人
参考资料:[1] Carbery, J., & Buhrmester, D. (1998). Friendship and need fulfillment during three phases of young adulthood. Journal of Social and Personal Relationships, 15(3), 393–409.
[2] Rawlins, W. K. (1992). Friendship matters: Communication, dialectics, and the life.
微信公众号:第一心理