[LeetCode] Word Ladder

Given two words (start and end), and a dictionary, find the length of shortest transformation sequence from start to end, such that:

Only one letter can be changed at a time
Each intermediate word must exist in the dictionary

For example,

Given:
start = "hit"
end = "cog"
dict = ["hot","dot","dog","lot","log"]

As one shortest transformation is "hit" -> "hot" -> "dot" -> "dog" -> "cog",
return its length 5.

Note:

Return 0 if there is no such transformation sequence.
All words have the same length.
All words contain only lowercase alphabetic characters.

这道题目首先想到的是DFS，或曰backtracking，也就是每次都找到一个可能的路径，最后比较所有路径中最小的就是题目所求。这样做显然需要较多的时间，因为我们遍历了所有的可能性。那么，有没有更加快捷的方案呢？
答案是显然的，那就是BFS。CareerCup上有这道题目，当时没有注意总结成这么抽象的方法，这次一定要好好总结一下。首先，虽然题目中没有一个“图”的概念，但是我们可以假想构建一个图，其中图中的每个顶点都是我们的元素，点和点是如何联系起来的呢？如果一个单词通过改变一次字母，能够变成另外一个单词，我们称之为1 edit distance 距离（是不是想起了leetcode中edit distance那道题目了？）所以，图中的所有相邻元素都是edit distance 距离为1的元素。那么，我们只需要做BFS，哪里最先遇到我们的target word，那么我们的距离就是多少。如果遍历完所有的元素都没有找到target word，那么我们就返回1。
另外一个需要注意的地方就是，如果我们曾经遍历过某个元素，我会将其从字典中删除，以防以后再次遍历到这个元素。这里有几种情况：
1.以后再也遍历不到这个元素，那么我们删除它当然没有任何问题。
2.我们以后会遍历到该元素，又分为两种情况：
(1)在本层我们就能遍历到该元素。也就是说，我们到达这个元素有两条路径，而且它们都是最短路径。
举一个例子应该比较容易理解：比如hot->hog->dog->dig和hot->dot->dog->dig，那么在第一次遍历距离hot为1的元素时，我们找到了hog和dot。对hog遍历时，我们找到了dog，并且将其从字典中删除。那么在遍历距离dot为1的元素时，我们实际上是找不到dog的，因为已经被删除了。对于本题来说，是没有什么影响的，因为到dog距离都是3，到dig距离都是4，我们要的是最小，所以选择3，对于后续没什么影响。但是后面我们做word ladder 2的时候，如果没有考虑这个情况，将是非常致命的，因为题目要求输出最短路径的所有情况，我们稍后讨论相关问题
(2)在更下层我们才能够遍历到该元素。比如hot->dot->dog->dig和hot->hat->dat->dag->dog->dig，如果第一次我们找到了dog并且将其删除，那么第二次我们实际上是找不到这个元素的。这样对于本题来说，没有任何影响。对于word ladder 2来说，因为也是要输出最短路径，所以也不会有任何影响。但是倘若我们要输出从起点到终点的所有路径，那么我们就要小心这种情况了。

所以，从这里我们也能够得到这样一个结论：对于题目来说，一定要深刻理解每一步为什么要这样做。因为每种方式或多或少都会根据题目的特性做一些优化（比如word ladder I 和word ladder II），不仅仅要知道为什么要做优化，而且要知道优化的代价是什么，在什么情况下适用，什么情况下不适用。
另外一点就是，每做一道题目都要好好总结一下，看看通过这道题目能够学会什么。好的题目，应该是会学会一个更加一般性的方法。现在没有时间去看CLRS，但是好好总结每一道题目，学会的方法也不会少。

思路上，请参考

http://blog.csdn.net/yutianzuijin/article/details/12887747

注意，初始值为2，即包括start和end 两个元素

 1 class Solution {
 2     public:
 3     int ladderLength(string start, string end, unordered_set<string> &dict)
 4     {
 5         if(start.empty() || end.empty() )
 6             return 0;
 7         if(start.size() != end.size())
 8             return 0;
 9         if(start.compare(end) == 0)
10             return 1;
11 
12         size_t size =  start.size();
13 
14         queue<string> cur, next;
15         cur.push(start);
16 
17         int length = 2;
18 
19         while(!cur.empty())
20         {   
21             string org = cur.front();
22             cur.pop();
23 
24             for(int i = 0; i< size; i++)
25             {   
26                 string tmp = org;
27                 for(char j = 'a'; j <= 'z'; j++ )
28                 {   
29                     if(tmp[i] == j)
30                         continue;
31                         //cout << "tmp = " << tmp << endl;
32                     if(tmp.compare(end) == 0)
33                         return length ;
34                     tmp[i] = j;
35                     if(dict.find(tmp) != dict.end())
36                     {
37                         //cout << "push queue " << tmp << endl;
38                         next.push(tmp);
39                         dict.erase(dict.find(tmp));
40                     }
41                 }
42             }
43             if(cur.empty() && !next.empty())
44             {
45                 swap(cur, next);
46                 length ++ ;
47             }
48         }
49         return 0;
50     }
51 };

几个程序中需要注意的细节：
1. ditance变量应该初始化为1。这个其实没有定数，不过根据题目的要求，比如hot->hog->dog，距离是3，由于我们每次distance只有在变化的时候才能增加（也就是说，我们这个变量实际上反映的是，我们“变化”了多少层），所以应该初始化为1
2.如何初始化一个string。由于queue.front()返回的是元素的引用，因此我们必须拷贝那个变量，所以使用string str(queToPop.front());来初始化，然后将元素pop。
3.C++中，实际上提供了swap函数的模板，不得不说还是很方便的。

posted @ 2014-07-01 10:37 穆穆兔兔阅读(485) 评论(1) 收藏举报

刷新页面返回顶部

mumututu's growing

高山自仰止,流水不争先

[LeetCode] Word Ladder

公告