拿硬币——动态规划
拿硬币
Question: 有10个硬币,我和你按顺序拿,每次可以拿1、2或者4个,拿到最后一个硬币的人输,你怎么确保自己可以获胜
(这个问题的有一个前提:双方都想赢,并且当遇到能赢的情况时,他们能做出正确的决策而不是随便决策)
这种问题,可以从简单情况先想起,:
没有硬币剩下,则默认该轮次的人胜利。
剩下一个硬币时,先手拿硬币的人输,后手赢;
剩下两个硬币时,先手的人一下子拿两个,则先手输。
先手的人拿一个,刚才推过,可以知先手赢。
所以,面对这种情况,先手时你可以认为你赢定了。、剩下三个硬币时,先手的人如果只拿一个,剩下两个硬币,则我们刚才推过,这种情况你会输。
先手的人如果拿两个,剩下一个硬币,你赢。
所以,对于这种情况,先手的人也赢定了。剩下四个硬币时,先手的人拿四个,则先手人会输。
先手如果拿两个,我们刚才推过,先手也输定了。
先手如果拿一个,也是上面推过,先手输定了。
…..
依此下来,我们是不是发现,对于固定的剩余硬币数量,先手还是后手直接可以决定你的输赢。
其实,这是利用了动态规划的思想。
我们假设f(i)表示结果,0表示输,1表示赢。
当轮到你去取硬币时,我们假设面前有i枚硬币,你有三种取法(即取 1,2,4),当你取完就该对手取,如果说三种取法里面只有有一个取法能够让对手最后输掉,那么可以说你就赢了。
写成状态转移方程:
f(i)=(f(i-1)==0 || f(i-2)==0 || f(i-4)==0 ) ①
状态推算:
f(0)=1
f(1)=0
f(2)=1
f(3)=1
f(4)=0
f(5)=1
f(6)=1
f(7)=0
f(8)=1
f(9)=1
f(10)=0
所以,对于10枚硬币,先手拿不管怎么拿必输,因为后面的局面完全可以被后手的人掌握主动权,所以你要后手拿,然后你就可以根据表格获得制胜的策略。
10枚可以自己去推,我们简单来推测下,为什么7枚后手怎么赢。
- 如果对方拿4枚,剩3枚,将i==3带入公式①,我们发现 f(3-1)==0,所以我们取 1 枚,剩下一枚,胜利!
- 如果对方拿2枚,剩下5枚,将i==5带入公式,发现f(5-1)==0,所以我们取 1 枚,剩下 4 枚,我们在前面推过,面对4枚对方先手,他输定了。
如果对方拿1枚,剩6枚,将i==6带入公式,发现f(6-2)==0,所以取 2 枚,又剩下四枚,同样的情况,你赢定了。
所以,7枚后手具体是这样,10枚后手胜利也是这个道理。