囚徒困境囚徒困境•囚徒困境(prisoner'sdilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况
•1950年,由就职于兰德公司的梅里尔·弗拉德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”
经典的囚徒困境经典的囚徒困境•警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:•若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年
•若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年
•若二人都互相检举(互相“背叛”),则二人同样判监2年
甲沉默(合作)甲认罪(背叛)乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年•如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略
•囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短
两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低
试设想困境中两名理性囚徒会如何作出选择:•若对方沉默、背叛会让我获释,所以会选择背叛
•若对方背叛指控我,我也要指控对方