第三讲混合策略纳什均衡•我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的策略组合,即(s1*,…,si*,…,sn*)是一个纳什均衡,当且仅当(ui(si*,s-i*)≥ui(si′,s-i*)。根据这一定义,有些博弈不存在纳什均衡的。•社会福利博弈•流浪汉•找工作游荡•救济3,2-1,3•政府•不救济-1,10,0•这个博弈不存在纳什均衡。给定政府救济,流浪汉的最优策略是游荡;给定流浪汉游荡,政府的最优策略是不救济;给定政府不救济,流浪汉的最优策略是找工作;给定流浪汉找工作,政府的最优战略是救济;如此等等,没有一个策略组合构成纳什均衡。•猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚)•B•正面反面•正面-1,11,-1•A•反面1,-1-1,1•上述两个博弈的显著特征是,每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略。这样的情况出现在诸如体育比赛和战争等情况中都会出现。在这类博弈中,都不存在纳什均衡。•上述两个博弈不存在纯策略纳什均衡,但是存在下面将要定义的混合策略纳什均衡。这里的混合策略是指参与人以一定的概率选择某种策略,比如说,参与人以0.3概率选择第一种策略,以0.2的概率选择第二种策略,以0.5的概率选择第三种策略。如果一个采取混合策略,他的对手就不能准确猜出他实际上会选择的策略,但在均衡点可以知道对手不同策略的概率分布。•流浪汉•找工作游荡•救济3,2-1,3•政府•不救济-1,10,0•设想政府以1/2的概率选择救济,1/2的概率选择不救济。对流浪汉来说,选择寻找工作的期望效用是1/2×2+1/2×1=1.5,选择游荡带来的期望效用为1/2×3+1/2×0=1.5。所以流浪者的任何一种策略(纯的或混合)都是对政府所选择的混合策略的最优反应。•如果流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡,政府的任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择,这一混合策略组合就是一个纳什均衡混合策略的定义:在博弈G={s1,s2,…,sn}中,博弈方i的策略空间为Si=(si1,si2,…,sik),则博弈方以pi=(pi1,pi2,…,pik)随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1,k=1,2,…,k,且pi1+pi2+…+pik=1相对于这种以一定概率分布在一些策略中随机选择,原来的确定性的具体的策略称为纯策略,原来的纳什均衡也称为纯策略纳什均衡。纯策略也可看作特殊的混合策略。我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡。•混合策略纳什均衡的求法,可以通过计算各方的期望得益,寻求使自己期望得益最大化的最佳反应函数,求各博弈方的最佳反应函数的公共解。可以用求最佳反应函数交点的方法,也可以用解方程组得方法。还可以应用下面的原则来计算:任何博弈方的在混合策略纳什均衡中的所选策略,都必须使其他博弈方选择其任何策略的期望得益相同。即自己的选择要使对方无机可乘,不能通过有针对性的倾向是某一策略成为优势策略。再举一个例子。•例某博弈的得益矩阵为•乙•CD•A2,35,2•甲•B3,11,5•这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡,设甲的混合策略为(p,1-p),•则甲的选择必须使乙选C和选D的期望得益相等,即:p×3+(1-p)×1=p×2+(1-p)×5•解得p=0.8。即甲的混合策略是(0.8,0.2)•同样,设乙的混合策略为(q,1-q),则乙的纳什均衡策略也必须使甲无论选A还是选B的期望收益相等。即:•q×2+(1-q)×5=q×3+(1-q)×1•解得q=0.8即乙的混合策略也是(0.8,0.2)•容易算出在这个混合策略纳什均衡下,甲乙各自的得益都是2.6.它的意义是说,虽然在一次博弈中,其结果只能是得益矩阵中四个得益的一种,但多次独立重复进行,平均结果是双方各得2.6.•1.制式问题彩电有不同的制式,采用相同的制式,则不同厂商间的零部件可以通用,相关设备可以相互匹配,对大家有一定的好处,但也有互相竞争的压力和损失。设两个厂商要引进生产线,面临A、B两个制式,其得益矩阵如下:•厂商2•AB•A1,30,0•厂商1•B0,02,2•容...