1 动态博弈与逆向归纳法 假如欺负他人可以获得快乐,那你会欺负他人吗?大多数人的回答是不会,原因正如他们所指出的,欺负他人会担心他人的报复,这抵消了从欺负他人的行为中所能得到的快乐。这个答案至少表明,你之所以现在没有欺负他人,并不因为不想欺负他人,而是因为你知道欺负他人会在将来给自己造成麻烦。同样,当我们面临一些博弈对局的时候,我们应如何采取现在的行动,常常取决于每个行动在将来会产生什么后果,或者说在将来别人将如何反应。 在前面各章内容中,博弈是静态的——或者说是同时行动的。而现实中的博弈常常是动态的、依序行动的,这就要求我们必须考虑人们在将来对我们的行动反应。分析序贯行动博弈的一个重要思路就是:向前展望,向后推理(looking forward and reasoning backward),即面向未来,思考现在,站在未来的立场来确定现在的最优行动。本章我们将通过一些例子来说明这一分析思路,其中有些例子很有趣,也很有挑战性。 §5-1 逆向归纳法 1、美中军 事 政 治 博弈 我们通过一个简 单 的例子来说明序贯博弈的( 离 散 策 略 的) 扩 展式 表达 和逆 向归 纳 法 求解 方 法 。这个例子可以称 做 美中军 事 政 治 博弈,或者叫 “ 毛 泽 东 的对外 军 事 政 治 战略 ”。 故 事 模 型 在我国 解 放 初 期 ,美国 一直 试 图 对我国 实施 打 击 。此 时,我国 必须对美国采取应对之策 。就我国 对美国 可以采取的行动而言 ,无 非 是回击 或不回击 。用 更符 合 毛 泽 东 的话 来说,美国 可以“ 犯 我” 或“ 不犯 我”,而我们可以“ 犯 人” 或“ 不犯 人”。 由 此 我们可以刻 画 出一个动态博弈: ● 博弈方 :美国 、中国 ; ● 行动空 间 :美国 可选 择 的行动是“ 犯 我” 或“ 不犯 我”; 中国 的选 择 是“ 犯人” 或“ 不犯 人”; ● 行动顺 序:美国 先 行动; 中国 观 察 到美国 的行动后再 选 择 自己的行动; ● 赢 利 :我们这样假设 赢 利 状 况 ( 数字 是虚 拟 的); ● 如果美国 “ 犯 我”,中国 “ 犯 人”,恶 战再 所难 免 ,则 美国 亏 损2,中国 2 美国 亏损2; ●如果美国“犯我”,中国“不犯人”,那么中国沦为美国的附庸,丧失国家主权,则美国获得 2,中国亏损4; ●如果美国“不犯我”,中国...