线性规划习题(32)
(23)矩阵对策的最优纯策略 甲乙乒乓球队进行团体对抗赛,每对由三名球员组成,双方都可排成三种不同的 阵容,每一种阵容可以看成一种策略,双方各选一种策略参赛。比赛共赛三局, 规定每局胜者得 1 分,输者得-1 分,可知三赛三胜得 3 分,三赛二胜得 1 分,三 赛一胜得-1 分,三赛三负得-3 分。甲队的策略集为 S1={α1,α2,α3},乙队的策略 集为 S1={β1,β2,β3},根据以往比赛得分资料,可得甲队的赢得矩阵为 A,如下:
A=
1 1 3
1 -1 -1
1 -3 3
试问这次比赛各队应采用哪种阵容上场最为稳妥。 解:甲队的 α1,α2,α3 三种策略可能带来的最少赢得,即矩阵 A 中每行的最小元 素分别为: 1,-3,-1, 在这些最少赢得中最好的结果是 1,即甲队应采取策略 α1 ,无论对手采用什么
策略,甲队至少得 1 分。而对乙队来说,策略 β1,β2,β3 可能带来的最少赢得, 即矩阵 A 中每列的最大因素(因为两人零和策甲队得分越多,就使得乙队得分越 少) ,分别为: 3,1,3, 其中乙队最好的结果为甲队得 1 分,这时乙队采取 β2 策略,不管甲队采用什么 策略甲队的得分不会超过 1 分(即乙队的失分不会超过 1) 。这样可知甲队应采用 α1 策略,乙队应采取β 2 策略。把这种最优策略 α1 和 β2 分别称为局中人甲队、乙 队的最优纯策略。这种最优纯策略只有当赢得矩阵 A=(aij)中等式 max min aij = min max aij i j j i
成立时,局中人才有最优纯策略,并把(α1 ,β2)称为对策 G 在纯策略下的解, 又称(α1 ,β2)为对策 G 的鞍点。 (24)矩阵对策的混合策略
A=
5 8
9 6
解:首先设甲使用 α1 的概率为 X1’,使用 α2 的概率为 X2’,并设在最坏的情况下 (即乙出对其最有利的策略情况下) ,甲的赢得的平均值等于 V。这样我们建立以 下的数学关系: 1.甲使用 α1 的概率 X1’和使用 α2 的概率 X2’的和为 1,并知概率值具有非负性, 即 X1’+ X2’=1,且有 X1’?0,X2’?0. 2.当乙使用 β1 策略时, 甲的平均赢得为: 1’+ 8X2’, 5X 此平均赢得应大于等于 V, 即 5X1’+ 8X2’?V 3.当乙使用 β2 策略时, 甲的平均赢得为:9X1’+ 6X2’,此平均赢得应大于等于 V, 即 9X1’+ 6X2’?V
第二步,我们来考虑 V 的值,V 的值与赢得矩阵 A 的各因素的值是有关的,如 果 A 的各元素的值都大于零,即不管甲采用什么策略,乙采用什么策略,甲的赢 得都是正的。这时的 V 值即在乙出对其最有利的策略时甲的平均赢得也显然是正 的。因为 A 的所有元素都取正值,所以可知 V?0. Xi' 第三步,作变量替换,令 Xi = (i=1,2) V 考虑到 V?0,这样把以上 5 个数量关系式变为: 1 X1+ X2 = ,X1?0,X2?0, V 5X1+ 8X2 ?1 9X1+ 6X2 ?1 1 对甲来说,他希望 V 值越大越好,也就是希望 的值越小越好,最后,我们就 V 建立起求甲的最优混合策略的线性规划的模型如下:
min X1+ X2 5X1+ 8X2 ?1 9X1+ 6X2 ?1 X1?0,X2?0 同样求出乙最优混合策略,设 y1’, y2’分别为乙出策略 β1,β2 的概率,V 为甲出 对其最有利的策略的情况下,乙的损失的平均值。 同样我们可以得到: y1’+ y2’=1, 5y1+ 9y2 ?V 8y1+ 6y2 ?V y1’?0,y2’?0. yi' 同样作变量替换,令 yi = (i=1,2) V 1 得关系式: y1+ y2 = V 5y1+ 9y2 ?1 8y1+ 6y2 ?1 y1?0,y2?0. 1 乙希望损失越少越好,即 V 越小越好而 越大越好,这样我们也建立了求乙的 V 最优混合策略的线性规划的模型如下: max y1+ y2 约束条件: 5y1+ 9y2 ?1 8y1+ 6y2 ?1 y1?0,y2?0. 约束条件:
伊拉克是挺可怜的