博弈逻辑(Game logic)
目录 |
博弈论研究人类活动中的互动行为,在经济学中得到广泛的运用。在博弈论中,人类的所有活动,只要是互动行为,均可以看成是博弈行动。在此基础上,一种新的逻辑“博弈逻辑”(game logic)得以兴起,它是一种特殊的行动逻辑(action logic)。
“博弈逻辑” 英文为“game logic”。“game”的基本意义是游戏。日常生活中的打牌、下棋、猜谜以及各种体育比赛都是不同种类、不同形式的游戏。很多游戏有一个共同的特点,即策略在其中起着很大的作用。因此,有些学者也把“game”译做“对策”,相应的“game logic” 译为“对策逻辑”。[1]
博弈逻辑是研究“理性的”行动者或参与者在互动的过程中如何选择策略或如何做出行动的逻辑。博弈逻辑有两个基本假定:第一,博弈参与者是理性的,即参与者努力使自己的得益最大化;第二,博弈参与者的利益不仅取决于自己的行动,同时取决于他人的行动。[1]
可见,构成一个博弈需包含以下几个要素[1]:
1、博弈的参与者players。博弈中的每个独立参与者可称为一个“博弈方”。博弈方可以是个人,也可以是决策团体。有时自然也可以成为博弈方。比如,在风险型博弈和不确定型博弈的一人博弈中,自然就是一个博弈方。
2、博弈方各自可选择的全部策略Strategies或行为Actions的集合。一个策略是一套完整的行动方案,它事先确定一个博弈方在对局过程中出现的一切可能情况下采取什么方法或做法。在不同的博弈中可供博弈方选择的策略或行为的数量很不相同,即使在同一博弈中不同博弈方可选策略或行为也常不同,有时只有有限的几种,而有时又有可能有许多种,甚至无限多种。
3、博弈方的得益Payoff。对应于各博弈方的每一组可能的决策选择,博弈都有一个结果表示各博弈方在该策略下的所得和所失。博弈中的这些可能结果的量化数值,称为各博弈方在相应情况下的“得益”。规定一个博弈必须对得益做出规定,得益可以是正值,也可以是负值,它们是分析博弈模型的标准和基础。
通过上述方法定义了各种博弈行为,由此也就确定了博弈逻辑的研究对象。
在博弈逻辑中,依据博弈方数量的不同,可以对其进行不同的划分。学术界目前有两种不同的观点。大多数学者的观点是将其划分为二人博弈逻辑和多人博弈逻辑;还有一些学者,将一人博弈逻辑也纳入进来。按照他们的观点,博弈逻辑可划分为一人博弈逻辑、二人博弈逻辑和多人博弈逻辑。本文对这两种观点持有异议,认为一人博弈逻辑中的风险型个人博弈逻辑和不确定型个人博弈逻辑可以纳入进来,而不应当包括确定型个人博弈逻辑。理由如下:
第一,博弈逻辑中至少应存在两个独立的博弈参与者(博弈方)。
第二,在“风险型个人博弈”和“不确定型个人博弈”中,我们可以把自然看作是与个人相对的另一个博弈方,可看作是“一人对自然的博弈”。在这两类博弈中,结果受到自然的影响,个人不能完全支配结果,因为他的选择并不导致能够确定预测的结果。这两类博弈的结果部分地取决于个人的选择,部分地依赖于一个虚构的博弈方(自然)的选择,当然,自然的选择不是自觉的、有意识的。有了自然这个虚构的博弈方,一人对自然的博弈就可以纳入博弈逻辑分析的范围了。
第三,有些学者提出的“确定型个人博弈”,其特点是个人完全支配着行动的结果。而且他的每一行动的结果既不受他人的干预,也不受自然的影响。它是一种完全没有对手的局面——没有选择的相互依赖性,因此不是博弈逻辑所研究的范围。
由此,认为博弈逻辑包含以下几方面的内容:
1、一人博弈逻辑。一人博弈逻辑即以个人和自然分别为博弈方的逻辑,包括风险型个人博弈逻辑和不确定型个人博弈逻辑。风险型个人博弈逻辑中,决策者本人要同自然做斗争,他不能确切地知道会出现哪一种可能的自然状态,但是能够有意义地给自然状态分配概率,即能够确定或推算每一可能状态的频率。比如,抽奖就是一个典型例子,根据奖券总数和得奖数,可以推算出一张奖券得奖的概率。而在不确定型个人博弈逻辑中,可能结果的概率估计没有足够的统计数据或频率可以依据,因此很难给自然状态分配概率。比如一个病人患了疑难病症,医生要在几种治疗方案中选择一种,而这种治疗方法能治好他疾病的概率是很难计算的。一人博弈逻辑是博弈逻辑的基础。
2、二人博弈逻辑。二人博弈逻辑就是两个各自独立决策,但策略和利益具有相互依存关系的博弈方如何合理选择策略的逻辑。根据博弈中的得益情况,二人博弈逻辑又可分为二人零和博弈逻辑和二人变和博弈逻辑。二人零和博弈逻辑研究的是博弈双方得益之和等于零的情况,在这种博弈中,博弈方的利益是完全相反的,没有任何调和的余地。而在二人变和博弈逻辑中,博弈方的利益不是完全相反的,而是部分一致部分矛盾的,这两个博弈方在不同策略组合下各博弈方的利益之和往往是不同的。
3、多人博弈逻辑。多人博弈逻辑也是博弈方在意识到其他博弈方的存在,意识到其他博弈方对自己决策的反应和反作用存在的情况下,为寻求自身最大利益而采取行动的逻辑。多人博弈逻辑有三个或三个以上的博弈方。根据博弈的规则,多人博弈逻辑可分为合作博弈逻辑和非合作博弈逻辑两类。
此外,学术界中对博弈逻辑还有其他的分类,如根据信息结构分为完全信息博弈逻辑和不完全信息博弈逻辑;根据博弈过程可分为静态博弈和动态博弈。这些分类都是很有意义的,可以从不同方面、不同角度切入,从而对博弈逻辑进行更深入的探讨和研究。
博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人,在经济活动中理性的人即是使经济目标最大化的人——经济人。理性人如何使得自己的“得益”最大?关键是“推理”。
博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统,建立新的博弈逻辑系统。在这方面,日本筑波大学的金子守(Mamoru Kaneko)教授是这方面的权威。近几年,他在国际刊物上发表了大量有关博弈逻辑方面的论文。他不仅在模态逻辑系统的基础上建立了多个博弈逻辑 (game logic)系统,而且,建立了与博弈逻辑密切相关的公共知识逻辑(common knowledge logic)系统。第二种研究纲领是研究博弈活动中的实际“推理问题”,许多博弈论专家在此方面做了大量的工作。
根据博弈论,人们在实际的博弈活动中涉及到两种推理:演绎推理与归纳推理。然而,正如传统逻辑中存在着悖论(演绎悖论和归纳悖论),在博弈逻辑中同样存在着悖论。
一个分蛋糕的例子:n个人分一块大蛋糕,每个人都希望能最大化自己的所得,那么怎么分才公平呢?(这里的公平是指每个人都认为自己可以使自己分得的那部分不少于1/n。)
如果n=2,可以使用历史悠久的“我分你选”算法,可以实行公平的分配。当n>=3时,有几种可能的分法。我们讨论一种“修整法”:当第一个人切下一块“属于”他的蛋糕时,这块蛋糕必须由其他n–1个人进行审查,在审查过程中,如果有人觉得这块蛋糕太大,可以对它进行修整,切下的那些放回原处。蛋糕被轮流检查过以后,如果这n-1个人当中没有任何人修整它,这块蛋糕就属于第一个人,如果至少有一个人对它进行了修整,那么这块蛋糕就属于最后一个修整它的人。这种算法能保证蛋糕的公平分配,我们可以通过博弈逻辑这一工具对此加以证明。