[笔记]极大极小过程的alpha-beta剪枝不可与记忆化搜索一起使用
今天做SGU 423,WA得我眼泪汪汪。后来发现原来这个问题很早就被何牛提到过:
极大极小过程的alpha-beta剪枝不可与记忆化搜索一起使用。
原因是这样的:
在一个博弈图中,可能存在这样的情况:一个状态有不止一个前继。
比如,设状态u和状态v都可以转移到同一个状态w。
假设极大极小过程先搜索到u,为了得到u的估值f(u),我们要搜索w并且给本次搜索一个估值上界beta(u),一旦在w的搜索过程中发现f(w)当前值>=beta(u),则立刻停止搜索因为f(u)的估值不会用到w这个分支。这就是alpha-beta剪枝。
但是请注意,此时并不保证f(w)的正确性,我们仅仅知道f(w)>=beta(u)而已。这次剪枝仅仅保证u的搜索结果的正确性。
为了得到v的估值f(v)我们会再次搜索到w,注意此时所给的估值上界是beta(v)而不是beta(u),也就是这两次搜索对于w的限制是不同的。如果使用记忆化,就相当于默认f(w)为精确值。但是由于之前的剪枝,我们得到的仅仅是f(w)的一个界而已,这里就会出现错误。更确切地,当beta(v)>beta(u)时,就会由于u与beta(u)对于w的限制被记忆,导致计算v的估值所需要的w的信息被误剪。
T_T
顺便贴个alpha-beta剪的思路模板吧:
//alpha-beta剪枝 //不可以和记忆化搜索混用 //需要在外部记录状态(局面以及当前先手者),通过make_move和unmake_move函数进行改变。 int ab(int alpha, int beta, int depth, bool pass) { // 当前最佳估值,预设为负无穷大 int best = -INF; // 如果到达预定的搜索深度 if (depth <= 0) { // 计算出估值 return eval(); } // 尝试每个后继状态 foreach (move) { // 试着走后继状态 if (make_move(move)) { // 如果合法,对所形成的局面进行递归搜索 int now = -alpha_beta(-beta, -alpha, depth-1, 0); // 恢复原来的局面 unmake_move(move); // 如果这步棋引发剪枝 if (now >= beta) { // 停止对当前局面的搜索,立即返回。 return now; } // 如果这步更好 if (now > best) { // 保存更好的结果 best = now; // 更新估值下限 if (now > alpha) { alpha = now; } } } } // 如果没有合法后继,则此步为弃着 if (best == -INF) { // 如果上一步也是弃着,表明对局结束 if (pass) { // 计算出精确值 return calc(); } // 否则这步棋弃着,局面不变先后手互换 make_move(PASS_MOVE); // 递归搜索,并标明该步弃着。 best = -alpha_beta(-beta, -alpha, depth, 1); // 恢复原来的局面 unmake_move(PASS_MOVE); } // 返回最佳估值 return best; }