博弈树与逆向归纳法1

下载本文档

阅读 125
下载 30
格式 pdf
大小 1.23 MB
约17页
2025-02-08 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/17页

2/17页

3/17页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/17

文本预览下载提示常见问题

1 动态博弈与逆向归纳法假如欺负他人可以获得快乐，那你会欺负他人吗？大多数人的回答是不会，原因正如他们所指出的，欺负他人会担心他人的报复，这抵消了从欺负他人的行为中所能得到的快乐。这个答案至少表明，你之所以现在没有欺负他人，并不因为不想欺负他人，而是因为你知道欺负他人会在将来给自己造成麻烦。同样，当我们面临一些博弈对局的时候，我们应如何采取现在的行动，常常取决于每个行动在将来会产生什么后果，或者说在将来别人将如何反应。在前面各章内容中，博弈是静态的——或者说是同时行动的。而现实中的博弈常常是动态的、依序行动的，这就要求我们必须考虑人们在将来对我们的行动反应。分析序贯行动博弈的一个重要思路就是：向前展望，向后推理(looking forward and reasoning backward)，即面向未来，思考现在，站在未来的立场来确定现在的最优行动。本章我们将通过一些例子来说明这一分析思路，其中有些例子很有趣，也很有挑战性。 §5-1 逆向归纳法 1、美中军事政治博弈我们通过一个简单的例子来说明序贯博弈的（离散策略的）扩展式表达和逆向归纳法求解方法。这个例子可以称做美中军事政治博弈，或者叫 “ 毛泽东的对外军事政治战略 ”。故事模型在我国解放初期，美国一直试图对我国实施打击。此时，我国必须对美国采取应对之策。就我国对美国可以采取的行动而言，无非是回击或不回击。用更符合毛泽东的话来说，美国可以“ 犯我” 或“ 不犯我”，而我们可以“ 犯人” 或“ 不犯人”。由此我们可以刻画出一个动态博弈： ● 博弈方：美国、中国； ● 行动空间：美国可选择的行动是“ 犯我” 或“ 不犯我”；中国的选择是“ 犯人” 或“ 不犯人”； ● 行动顺序：美国先行动；中国观察到美国的行动后再选择自己的行动； ● 赢利：我们这样假设赢利状况（数字是虚拟的）； ● 如果美国 “ 犯我”，中国 “ 犯人”，恶战再所难免，则美国亏损2，中国 2 美国亏损2； ●如果美国“犯我”，中国“不犯人”，那么中国沦为美国的附庸，丧失国家主权，则美国获得 2，中国亏损4； ●如果美国“不犯我”，中国...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容