囚 徒 困 境 的 生 活 实 例分 析精品文档收集于网络,如有侵权请联系管理员删除囚徒困境的生活实例分析中南财经政法大学工商管理学院博弈论对人的基本假定是:人是理性的,理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的
“囚徒困境 ”是博弈论里最经典的例子之一
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严 ",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年
问题可以总结为:A 不坦白A 坦白B 不坦白各判 1 年A 释放 B 判 10 年B 坦白A 判 10年 B 释放各判 8 年在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果
A和B均坦白是这个博弈的纳什均衡
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年
即是说,不管A坦白或抵赖,B的最佳选择都是坦白
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白
结果,两个人都选择了坦白,各判刑8年
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡
囚徒困境反映了个人理性和集体理性的矛盾
如果A和B都选择抵赖,精品文档收集于网络,如有侵权请联系管理员删除各判刑1年,显然比都选择坦白各判刑8年好得多
当然,A和B可以在被警察抓到之前订立一个 "攻守同盟 ",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守