合 作 的 进 化 北京天那么经济讨论所第 139 次双周学术讨论会由吴坚忠博士作主题发言,研讨了美国学者艾克斯罗德提出的?合作的进化?问题,艾克斯罗德通过对多人屡次重复博弈的对策讨论,指出在博弈中产生合作的必要条件和获胜策略的主要特征。当策略群体是按各种策略的得分进行淘汰和进化时,艾克斯罗德发现,群体以一种不可逆转的方式向合作的方向进化,也就是说,群体的合作性随进化过程越来越大。与会学者在主题发言之后展开了热烈的讨论。以下是这次学术讨论会的综合观点。 一、 博弈中最优策略的产生 艾克斯罗德在开始讨论合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全根据自己利益最大化的企图进行决策。在此前提下,合作要讨论的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。社会实践中有很多合作的问题。比方国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。A 和 B 各表示一个人,他们的选择是完全无差异的。选择 C 代表合作,选择 D 代表不合作。假如 AB 都选择 C 合作,那么两人各得 3 分;假如一方选 C,一方选 D,那么选 C 的得零分,选 D 的得 5 分;假如 AB都选 D,双方各得 1 分。显然,对群体来说最好的结果是双方都选 C,各得 3 分,共得 6 分。假如一方选 C,一方选 D,总体得 5 分。假如两人都选 D,总体得 2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于 A 来说,当对方选 C,他选 D 得 5 分,选 C 只得 3 分;当对方选 D,他选 D 得 1 分,选 C 得零分。因此,无论对方选 C 或D,对 A 来说,选 D 都得分最多。这是 A 单方面的优超策略。而当两个优超策略相遇,即 A,B 都选 D 时,结果是各得 1 分。这个结果在矩阵中并非最优。困境就在于,每个人实行各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果表达了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。假如博弈...