笔记
数学
]
甲乙两人猜拳,甲只能出石头剪刀,策略
如果甲出剪刀,乙出剪刀平,乙出石头乙胜。
如果甲出石头,乙出剪刀乙输,乙出石头平。
所以不管甲出什么,乙出石头总是好过剪刀的,也就是说,乙不出剪刀。
策略 | 乙出石头 $y$ | 乙出布 $1-y$ |
---|---|---|
甲出石头 $x$ | $xy$ | $x(1-y)$ |
甲出剪刀 $1-x$ | $(1-x)y$ | $(1-x)(1-y)$ |
记随机变量 $X$ 为甲获胜的示性变量。那么 $\mathbb E[X]=-x(1-y)-(1-x)y+(1-x)(1-y)=1-2x-2y+3xy$。
记随机变量 $X$ 为乙获胜的示性变量。那么 $\mathbb E[Y]=-\mathbb E[X]=-1+2x+2y-3xy$。
由于纳什均衡,如果甲选定策略后,不管乙怎么修改策略,甲的期望都是不变的。也就是说
\[\begin{aligned} \frac{\partial\mathbb E[X]}{\partial y}&=0\\ -2+3x&=0\\ x&=\frac23 \end{aligned}\]同理,$\mathbb E[Y]$ 对 $x$ 偏导
\[\begin{aligned} \frac{\partial\mathbb E[Y]}{\partial x}&=0\\ 2-3y&=0\\ y&=\frac23 \end{aligned}\]- 甲出石头概率 $\frac23$,剪刀 $\frac13$,期望 $-\frac13$;
- 乙出石头概率 $\frac23$,布 $\frac13$,期望 $+\frac13$。
值得注意的是,必须提前讨论 $\mathbb P(\texttt{乙出剪刀})=0$。因为概率为 $0$ 后就不需要满足偏导为 $0$ 了。如果不去讨论这个,会解不出。记 $\mathbb P(\texttt{甲出石头})=x,\mathbb P(\texttt{乙出石头})=y,\mathbb P(\texttt{乙出剪刀})=z$。
\[\begin{cases} 3y+3z-2=0\\ 3x-1=0\\ 3x-2=0 \end{cases}\]运用纳什均衡还可以算出石头剪刀布中不管对手采取什么策略,我方均匀随机出石头剪刀布是赢的概率最大的。
策略 | 石头 $x$ | 剪刀 $y$ | 布 $1-x-y$ |
---|---|---|---|
石头 $a$ | $0$ | $ay$ | $-a(1-x-y)$ |
剪刀 $b$ | $-bx$ | $0$ | $b(1-x-y)$ |
布 $1-a-b$ | $(1-a-b)x$ | $-(1-a-b)y$ | $0$ |
最后解出来 $a=b=x=y=\frac13$。