第1页共8页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共8页综合I类/II类理性人的博弈策略[摘要]两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。但本文没有对此进行严格的数学证明。[关键词]I类理性,II类理性,混合战略,战略选择,不确定性在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征,即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。在计算收益的时候,使用的是个人所得。这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。具有II类理性特征的现象在很多方面都有存在。比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。有研究表明,国际关系中这样的II类理性的例子更不少见。这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。关键是对两种所得在考虑时的权数是随情况不同而变化的。如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责,但作为一种存在的现象,仍然有必要加以研究。但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。当博弈参与者是II类理性人时,此时收益矩阵的取值有一定的规律。假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)乙S1S2甲S1(m1,n1)(m2,n2)S2(m3,n3)(m4,n4)第2页共8页第1页共8页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共8页图1.I类理性参与人收益矩阵II类理性参与人的得益矩阵如下图所示:乙S1S2甲S1(m1-n1,n1-m1)(m2-n2,n2-m2)S2(m3-n3,n3-m3)(m4-n4,n4-m4)图2.II类理性参与人收益矩阵很明显,在II类理性参与人进行的博弈里,在每一个战略组合下,双方的得益之和必为零,此时的博弈具有零和的性质。这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间,作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。作为一个练习,我们把常见博弈模型改为零和博弈情形,来看相应的结果会是怎样的。一般认为,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是非常和的。例1.囚犯困境甲,乙涉嫌同谋犯罪,分别在两个房间被提审。提审官预先向两人交代政策:如果他们都承认犯罪事实,各判刑10年;如果两人都否认,双方都无罪释放;如果一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判15年。在非零和博弈情形下的支付矩阵如下:乙承认抵赖甲承认(-10,-10)(5,-15)抵赖(-15,5)(0,0)图3纳...