目录 |
以牙还牙(Tit for tat)是一个用于博弈论的重复囚徒困境(Reiterated Prisoner's Dilemma)非常有效的策略。这策略最先由数学家阿纳托·拉普伯特(Anatol Rapoport)提出,并在密歇根大学社会学家罗伯特·阿克塞尔罗(Robert Axelrod)有关囚徒困境的研究中击败其他方法,脱颖而出,成为解决囚徒困境的最佳策略。
这一策略有两个步骤:
1.第一个回合选择合作
2.下一回合是否选合作要看上一回对方是否合作,若对方上一回背叛,此回合我亦背叛;若对方上一回合作,此回合继续合作
以牙还牙策略有四个特点:
1.友善:以牙还牙者开始一定采取合作态度,不会背叛对方
2.报复性:遭到对方背叛,以牙还牙者一定会还击作出报复
3.宽恕:当对方停止背叛,以牙还牙者会原谅对方,继续合作
4.不羡慕对手:以牙还牙者个人永远不会得到最大利益,整个策略以全体的最大利益为依归
在众多策略中,以牙还牙是最有效的,曾连续数年击败由计算机科学家,经济学家和心理学家等团队所提出的策略。博弈论者尽管没有实质证据,但他们认为以牙还牙是最佳的策略。
假设有四个参与者:两个用以牙还牙的策略,另外两个无论任何时候都会背叛其他人以让自己得到最大的好处。假定每个参与者将要面对另外三个参与者进行六次对决。如果一名参与者背叛对方而对方不背叛,前者有5分,后者得0分;如果双方不背叛对方,双方各得3分;如果双方同时背叛对方,双方各得1分。
1.当以牙还牙者对背叛者,前者第一场比赛选择不背叛,而后者正好相反,后者获得5分。在余下的5场比赛,两位参与者背叛对方,每一场比赛各得1分。最后,背叛者得10分,以牙还牙者得5分。
2.当双方均为以牙还牙者,在所有6场比赛中彼此均不会背叛对方。双方每回合各得3分,最后每人各得18分。
3.当背叛者互相对赛,双方每次都会背叛对方。双方每回合各得1分,最后每人各得6分。
尽管以牙还牙者从来没有赢得过一场比赛,而背叛者从未输过一场比赛,考虑到双方的最大共同利益,以牙还牙仍然是最好的策略。