边工作边刷题：70天一遍leetcode: day 100

Coins in a Line, Flip Game, Nim Game

都是一类题，基本思路都是game AI里的minimax方法。基本方法网上很多，这里说说如何记住minimax算法结构。本质上是recursion，一般的recursion只需要每层做一次选择，但是对于minimax，因为一回合是两个player的决策，所以需要两个选择，然后再递归到下一层。recursion function的返回值优化特定player的value（一般是先手，这里假设player 1）。当player 1选择时，其一定选择几种可能的最大值，同理，当player 2选择时，其一定选择使player 1的value最小的选项。注意因为recursion function返回player 1的最优值，只有player 1的选择时累加value
递归的end condition是胜负结果都能直接一步得到，这样最优解也可以直接得到。

naive的递归存在大量重复计算，因为多条选择路径可以到达某一个subgame。可以用memoization or dp来优化。memoization比较简单：每次产生了subgame的最优解就存起来，每次进入递归检查是否解已经存在，如果存在就可以直接返回。dp的本质是用iteration来重构recursion的路径，然后沿着路径一步步（bottom up）求解subgame。

class Solution(object):
    def canWinNim(self, n):
        """
        :type n: int
        :rtype: bool
        """
        return n%4!=0

posted @ 2016-03-23 07:16 absolute100 阅读(141) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

边工作边刷题：70天一遍leetcode: day 100

Coins in a Line, Flip Game, Nim Game

公告