第三讲混合策略纳什均衡•我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的策略组合,即(s1*,…,si*,…,sn*)是一个纳什均衡,当且仅当(ui(si*,s-i*)≥ui(si′,s-i*)
根据这一定义,有些博弈不存在纳什均衡的
•社会福利博弈•流浪汉•找工作游荡•救济3,2-1,3•政府•不救济-1,10,0•这个博弈不存在纳什均衡
给定政府救济,流浪汉的最优策略是游荡;给定流浪汉游荡,政府的最优策略是不救济;给定政府不救济,流浪汉的最优策略是找工作;给定流浪汉找工作,政府的最优战略是救济;如此等等,没有一个策略组合构成纳什均衡
•猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚)•B•正面反面•正面-1,11,-1•A•反面1,-1-1,1•上述两个博弈的显著特征是,每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略
这样的情况出现在诸如体育比赛和战争等情况中都会出现
在这类博弈中,都不存在纳什均衡
•上述两个博弈不存在纯策略纳什均衡,但是存在下面将要定义的混合策略纳什均衡
这里的混合策略是指参与人以一定的概率选择某种策略,比如说,参与人以0
3概率选择第一种策略,以0
2的概率选择第二种策略,以0
5的概率选择第三种策略
如果一个采取混合策略,他的对手就不能准确猜出他实际上会选择的策略,但在均衡点可以知道对手不同策略的概率分布
•流浪汉•找工作游荡•救济3,2-1,3•政府•不救济-1,10,0•设想政府以1/2的概率选择救济,1/2的概率选择不救济
对流浪汉来说,选择寻找工作的期望效用是1/2×2+1/2×1=1
5,选择游荡带来的期望效用为1/2×3+1/2×0=1
所以流浪者的任何一种策略(纯的或混合)都是对政府所选择的混合策略的最优反应
•如果流浪汉以0
2的概率选择找工作,以0
8的概率选择游荡,政府的任何一种策略(