给出两个单词(start和end)与一个字典,找出从start到end的最短转换序列
问题
给出两个单词(start和end)与一个字典,找出从start到end的最短转换序列。规则如下:
- 一次只能改变一个字母
- 中间单词必须在字典里存在
例如:
给出
start = "hit"
end = "cog"
dict = ["hot","dot","dog","lot","log"]
返回
[
["hit","hot","dot","dog","cog"],
["hit","hot","lot","log","cog"]
]
注意
- 所有单词的长度一样
- 所有单词中只有小写字母
初始思路
最直接的想法是从start开始,对每个字母位置从'a'到'z'尝试替换。如果替换字母后的单词在字典中,将其加入路径,然后以新单词为起点进行递归调用,否则继续循环。每层递归函数终止的条件是end出现或者单词长度*26次循环完毕。end出现时表示找到一个序列,对比当前最短序列做相应更新即可。
处理过程中需要注意的主要有几点:
- 不能相同字母替换,如hot第一个位置遍历到h时不应该处理。否则就会不断的在hot上死循环。因此在替换后前要做一次检查。
- 我们要找的是最短的转换方案,所以转换序列不应该出现重复的单词。否则组合将会有无数多种,如例子中的["hit","hot","dot","dog","dot","dog","dog",....."cog"]。这里我们可以使用一个unordered_set容器来保存某次一次替换序列中已出现过的单词,也可以每次使用std:find去搜索当前替换序列。如果使用unordered_set,在递归处理时,和单词序列一样,要在递归后做相应的出栈操作。
- 处理过程中如果发现当前处理序列长度已经超过当前最短序列长度,可以中止对该序列的处理,因为我们要找的是最短的序列。
1 class Solution { 2 public: 3 std::vector<std::vector<std::string>> findLadders(std::string start, std::string end, std::unordered_set<std::string> &dict) 4 { 5 std::vector<std::vector<std::string>> result; 6 std::vector<std::string> entry; 7 8 entry.push_back(start); 9 Find(start, end, dict, 0, result, entry); 10 11 return result; 12 } 13 14 private: 15 void Find(std::string& start, const std::string& end, const std::unordered_set<std::string> &dict 16 , size_t positionToChange, std::vector<std::vector<std::string>>& result, std::vector<std::string>& entry) 17 { 18 //如果长度已经等于当前结果中的长度,再找出来肯定就 19 //超过了,终止处理 20 if(!result.empty() && entry.size() == result[0].size()) 21 { 22 return; 23 } 24 25 for(size_t pos = positionToChange; pos < start.size(); ++pos) 26 { 27 char beforeChange = ' '; 28 for(int i = 'a'; i <= 'z'; ++i) 29 { 30 //防止同字母替换 31 if(start[pos] == i) 32 { 33 continue; 34 } 35 beforeChange = start[pos]; 36 start[pos] = i; 37 38 //用std::find的话 39 /* 40 if(std::find(entry.begin(), entry.end(), start) != entry.end()) 41 { 42 start[pos] = beforeChange; 43 continue; 44 } 45 */ 46 //如果单词已经用过的情况 47 if(!used_.empty() && used_.count(start)!=0 ) 48 { 49 start[pos] = beforeChange; 50 continue; 51 } 52 53 54 if(start == end) 55 { 56 entry.push_back(start); 57 58 //只需要保存最短的序列 59 if(!result.empty()) 60 { 61 if(entry.size() < result[0].size()) 62 { 63 result.clear(); 64 result.push_back(entry); 65 } 66 else if(entry.size() == result[0].size()) 67 { 68 result.push_back(entry); 69 } 70 } 71 else 72 { 73 result.push_back(entry); 74 } 75 //完成一个序列,把前面加入的end弹出 76 entry.pop_back(); 77 return; 78 } 79 80 if(dict.find(start) != dict.end()) 81 { 82 entry.push_back(start); 83 used_.insert(start); 84 Find(start, end, dict, 0, result, entry); 85 used_.erase(*entry.rbegin()); 86 entry.pop_back(); 87 88 89 if(!entry.empty()) 90 { 91 start = *entry.rbegin(); 92 } 93 else 94 { 95 start[pos] = beforeChange; 96 } 97 } 98 else 99 { 100 start[pos] = beforeChange; 101 } 102 } 103 } 104 105 return; 106 } 107 108 std::unordered_set<std::string> used_; 109 }; 110 111 递归实现
提交测试,Judge Small没有问题。Judge Large不幸超时。
优化
观察我们的处理方法,找到可变换后的单词后,我们会马上基于它继续查找。这是一种深度优先的查找方法,即英文的DFS(Depth-first search)。这对找出答案很可能是不利的,如果一开始进入了一条很长的序列,就会浪费了时间。而广度优先BFS(Breadth-first search)的方法似乎更合适,当找到一个序列时,这个序列肯定是最短的之一。
要进行广度优先遍历,我们可以在发现替换字母后的单词在字典中时,不马上继续处理它,而是将其放入一个队列中。通过队列先进先出的性质,就可以实现广度优先的处理了。由于最后要输出的是整个转换序列,为了简单起见,我们可以将当前已转换出的序列放入队列中,即队列形式为std::vector<std::vector<std::string>>,序列的最后一个元素就是下次处理时要继续转换的单词。
使用广度优先遍历后,还有一个特性使得我们可以更方便的处理深度优先中重复单词的问题。当一个单词在某一层(一层即从第一个单词到当前单词的长度一样的序列)出现后,后面再出现的情况肯定不会是最短序列(相当于走了回头路),因此我们可以在处理完一层后直接将已用过的单词从字典中去除。需要注意的是,同一层是不能去除的,如例子中的hot在两个序列的第二层中都出现了。这样我们就需要一个容器把当前层用过的单词保存起来,等处理的层数发生变化时再将它们从字典里移除。
最后要注意的是查找结束的条件。由于找到了一个序列后该序列只是最短的之一,我们还要继续进行处理,直到队列中当前层都处理完毕。所以我们要在找到一个序列后将它的长度记录下来,当要处理的序列长度已经大于该值时,就可以结束查找了。
1 class Solution { 2 public: 3 std::vector<std::vector<std::string> > findLadders(std::string start, std::string end, std::unordered_set<std::string> &dict) 4 { 5 std::queue<std::vector<std::string>> candidate; 6 7 std::vector<std::vector<std::string>> result; 8 std::unordered_set<std::string> usedWord; 9 10 std::string currentString; 11 bool foundShortest = false; 12 size_t shortest = 0; 13 size_t previousPathLen = 0; 14 15 candidate.push({start}); 16 17 while(!candidate.empty()) 18 { 19 currentString = *candidate.front().rbegin(); 20 21 if(candidate.front().size() != previousPathLen) 22 { 23 for(auto iter = usedWord.begin(); iter != usedWord.end(); ++iter) 24 { 25 dict.erase(*iter); 26 } 27 } 28 29 if(foundShortest && candidate.front().size() >= shortest) 30 { 31 break; 32 } 33 34 for(size_t pos = 0; pos < start.size(); ++pos) 35 { 36 char beforeChange = ' '; 37 for(int i = 'a'; i <= 'z'; ++i) 38 { 39 beforeChange = currentString[pos]; 40 41 if(beforeChange == i) 42 { 43 continue; 44 } 45 46 currentString[pos] = i; 47 48 if(dict.count(currentString) > 0) 49 { 50 usedWord.insert(currentString); 51 52 if(currentString == end) 53 { 54 result.push_back(candidate.front()); 55 result.rbegin()->push_back(end); 56 foundShortest = true; 57 shortest = result.rbegin()->size(); 58 } 59 else 60 { 61 std::vector<std::string> newPath(candidate.front()); 62 newPath.push_back(currentString); 63 64 candidate.push(newPath); 65 } 66 } 67 currentString[pos] = beforeChange; 68 } 69 } 70 71 if(!candidate.empty()) 72 { 73 previousPathLen = candidate.front().size(); 74 75 candidate.pop(); 76 } 77 } 78 79 return result; 80 } 81 }; 82 83 BFS实现1
提交后Judge Large多处理了几条用例,但是最后还是超时了。
再次优化
一个比较明显的优化点是我们把存储序列的vector放到了队列中,每次都要拷贝旧队列然后产生新队列。回想一下我们使用vector的原因,主要是为了能保存序列,同时还能获得当前序列的长度。为了实现这两个目的,我们可以定义如下结构体:
1 struct PathTag 2 { 3 PathTag* parent_; 4 std::string value_; 5 int length_; 6 7 PathTag(PathTag* parent, const std::string& value, int length) : parent_(parent), value_(value), length_(length) 8 { 9 } 10 };
结构体记录了当前单词的前一个单词以及当前的序列长度。有了这个结构体,我们在最后找到end后就可以通过不断往前回溯得出整个路径。而这个路径是反向的,最后还需要做一次倒置操作。改进前面的BFS代码如下(需要注意的是,由于LeetCode里不能使用智能指针,我们通过辅助函数来申请和释放裸指针而不是直接new。如果不关心内存问题的话直接new了不管也可。):
1 class Solution{ 2 public: 3 ~Solution() 4 { 5 for(auto iter = pool_.begin(); iter != pool_.end(); ++iter) 6 { 7 delete *iter; 8 } 9 } 10 11 std::vector<std::vector<std::string> > findLadders(std::string start, std::string end, std::unordered_set<std::string> &dict) 12 { 13 std::queue<PathTag*> candidate; 14 15 std::vector<std::vector<std::string>> result; 16 std::unordered_set<std::string> usedWord; 17 18 std::string currentString; 19 bool foundShortest = false; 20 size_t shortest = 0; 21 size_t previousPathLen = 0; 22 23 candidate.push(AllocatePathTag(nullptr, start, 1)); 24 25 while(!candidate.empty()) 26 { 27 PathTag* current = candidate.front(); 28 currentString = current->value_; 29 30 if(current->length_ != previousPathLen) 31 { 32 for(auto iter = usedWord.begin(); iter != usedWord.end(); ++iter) 33 { 34 dict.erase(*iter); 35 } 36 } 37 38 if(foundShortest && current->length_ >= shortest) 39 { 40 break; 41 } 42 43 44 for(size_t pos = 0; pos < start.size(); ++pos) 45 { 46 char beforeChange = ' '; 47 for(int i = 'a'; i <= 'z'; ++i) 48 { 49 beforeChange = currentString[pos]; 50 51 if(beforeChange == i) 52 { 53 continue; 54 } 55 56 currentString[pos] = i; 57 58 if(dict.count(currentString) > 0) 59 { 60 usedWord.insert(currentString); 61 62 if(currentString == end) 63 { 64 65 GeneratePath(result, current, currentString); 66 foundShortest = true; 67 shortest = result.rbegin()->size(); 68 continue; 69 } 70 else 71 { 72 candidate.push(AllocatePathTag(current, currentString, current->length_ + 1)); 73 } 74 } 75 currentString[pos] = beforeChange; 76 } 77 } 78 79 if(!candidate.empty()) 80 { 81 previousPathLen = current->length_; 82 83 candidate.pop(); 84 } 85 } 86 87 return result; 88 } 89 90 private: 91 struct PathTag 92 { 93 PathTag* parent_; 94 std::string value_; 95 int length_; 96 97 PathTag(PathTag* parent, const std::string& value, int length) : parent_(parent), value_(value), length_(length) 98 { 99 100 } 101 102 }; 103 104 PathTag* AllocatePathTag(PathTag* parent, const std::string& value, int length) 105 { 106 if(nextPoolPos_ >= pool_.size()) 107 { 108 for(int i = 0; i < 100; ++i) 109 { 110 PathTag* newTag = new PathTag(nullptr, " ", 0); 111 pool_.push_back(newTag); 112 } 113 } 114 115 PathTag* toReturn = pool_[nextPoolPos_]; 116 toReturn->parent_ = parent; 117 toReturn->value_ = value; 118 toReturn->length_ = length; 119 120 ++nextPoolPos_; 121 122 return toReturn; 123 } 124 125 int nextPoolPos_; 126 127 std::vector<PathTag*> pool_; 128 129 void GeneratePath(std::vector<std::vector<std::string>>& result, PathTag* pathTag, const std::string& end) 130 { 131 std::vector<std::string> path; 132 133 path.push_back(end); 134 135 while(pathTag != nullptr) 136 { 137 path.push_back(pathTag->value_); 138 139 pathTag = pathTag->parent_; 140 } 141 142 size_t left = 0; 143 size_t right = path.size() - 1; 144 145 while(left < right) 146 { 147 std::swap(path[left], path[right]); 148 149 ++left; 150 --right; 151 } 152 153 result.push_back(path); 154 } 155 156 }; 157 158 BFS2
提交后Judge Large又多处理了几条用例,但是还是没能通过。
使用邻接列表
在继续优化之前,我们先来学习一个图论中的概念 - 邻接列表(Adjacency List)。具体细节可以参见这篇wiki:http://en.wikipedia.org/wiki/Adjacency_list 。简单来说,这是一个存储图中每个顶点的所有邻接顶点的数据结构。如无向图:
a
/ \
b --- c
它的邻接列表为:
a => b, c
b => a, c
c => a, b
具体到本问题,我们可以发现,start到end的所有序列,就是一个这些序列中所有单词为点组成的图。如果我们生成了该图的邻接列表,就可以不断的在每个单词的邻接列表里找到转换的下一个单词,从而最终找到end。那么,我们首先要对字典里的单词生成邻接列表:遍历字典里的单词,针对每个单词用前面逐字母替换的方法找出邻接单词,并保存起来。这里使用一个std::unordered_map<std::string, std::unordered_set<std::string>>来保存邻接列表。
有了邻接列表,寻找序列的方法就发生变化了。我们不再逐个替换字母,而是从start出发,遍历start的邻接顶点,将邻接顶点放入队列中。并重复操作直到队列为空。还有一个发生变化的地方是去重操作。由于不再遍历字典,现在我们发现非同层出现重复的单词就跳过它而不是从字典里删去。
剩下的生成路径的方法仍然和BFS2类似,全部代码如下:
1 class Solution { 2 public: 3 ~Solution() 4 { 5 for(auto iter = pool_.begin(); iter != pool_.end(); ++iter) 6 { 7 delete *iter; 8 } 9 } 10 11 std::vector<std::vector<std::string> > findLadders(std::string start, std::string end, std::unordered_set<std::string> &dict) 12 { 13 nextPoolPos_ = 0; 14 std::unordered_map<std::string, std::unordered_set<std::string>> adjacencyList; 15 std::string word; 16 17 for (auto iter = dict.begin(); iter != dict.end(); ++iter) 18 { 19 word = *iter; 20 BuildAdjacencyList(word, adjacencyList, dict); 21 } 22 23 std::vector<std::vector<std::string>> result; 24 std::queue<PathTag*> candidate; 25 std::unordered_map<std::string, int> usedWord; 26 27 std::string currentString; 28 bool foundShortest = false; 29 size_t shortest = 0; 30 31 candidate.push(AllocatePathTag(nullptr, start, 1)); 32 33 while(!candidate.empty()) 34 { 35 PathTag* current = candidate.front(); 36 37 if(foundShortest && current->length_ >= shortest) 38 { 39 break; 40 } 41 42 candidate.pop(); 43 44 auto adjacentIter = adjacencyList.find(current->value_); 45 46 if(adjacentIter != adjacencyList.end()) 47 { 48 for(auto iter = adjacentIter->second.begin(); iter != adjacentIter->second.end(); ++iter) 49 { 50 if(*iter == end) 51 { 52 GeneratePath(result, current, *iter); 53 foundShortest = true; 54 shortest = result.rbegin()->size(); 55 continue; 56 } 57 58 auto usedIter = usedWord.find(*iter); 59 60 61 if(usedIter != usedWord.end() && usedIter->second != current->length_ + 1) 62 { 63 continue; 64 } 65 66 usedWord[*iter] = current->length_ + 1; 67 68 candidate.push(AllocatePathTag(current, *iter, current->length_ + 1)); 69 } 70 } 71 else 72 { 73 continue; 74 } 75 76 } 77 78 return result; 79 } 80 81 private: 82 struct PathTag 83 { 84 PathTag* parent_; 85 std::string value_; 86 int length_; 87 88 PathTag(PathTag* parent, const std::string& value, int length) : parent_(parent), value_(value), length_(length) 89 { 90 } 91 92 }; 93 94 PathTag* AllocatePathTag(PathTag* parent, const std::string& value, int length) 95 { 96 if(nextPoolPos_ >= pool_.size()) 97 { 98 for(int i = 0; i < 100; ++i) 99 { 100 PathTag* newTag = new PathTag(nullptr, " ", 0); 101 pool_.push_back(newTag); 102 } 103 } 104 105 PathTag* toReturn = pool_[nextPoolPos_]; 106 toReturn->parent_ = parent; 107 toReturn->value_ = value; 108 toReturn->length_ = length; 109 110 ++nextPoolPos_; 111 112 return toReturn; 113 } 114 115 int nextPoolPos_; 116 117 std::vector<PathTag*> pool_; 118 119 void GeneratePath(std::vector<std::vector<std::string>>& result, PathTag* pathTag, const std::string& end) 120 { 121 std::vector<std::string> path; 122 123 path.push_back(end); 124 125 while(pathTag != nullptr) 126 { 127 path.push_back(pathTag->value_); 128 129 pathTag = pathTag->parent_; 130 } 131 132 size_t left = 0; 133 size_t right = path.size() - 1; 134 135 while(left < right) 136 { 137 std::swap(path[left], path[right]); 138 139 ++left; 140 --right; 141 } 142 143 result.push_back(path); 144 } 145 146 void BuildAdjacencyList(std::string& word, std::unordered_map<std::string, std::unordered_set<std::string>>& adjacencyList, const std::unordered_set<std::string>& dict) 147 { 148 std::string original = word; 149 150 for(size_t pos = 0; pos < word.size(); ++pos) 151 { 152 char beforeChange = ' '; 153 for(int i = 'a'; i <= 'z'; ++i) 154 { 155 beforeChange = word[pos]; 156 157 if(beforeChange == i) 158 { 159 continue; 160 } 161 162 word[pos] = i; 163 164 if(dict.count(word) > 0) 165 { 166 auto iter = adjacencyList.find(original); 167 if(iter != adjacencyList.end()) 168 { 169 iter->second.insert(word); 170 } 171 else 172 { 173 adjacencyList.insert(std::pair<std::string, std::unordered_set<std::string>>(original, std::unordered_set<std::string>())); 174 adjacencyList[original].insert(word); 175 } 176 } 177 178 word[pos] = beforeChange; 179 } 180 } 181 182 } 183 }; 184 185 邻接列表BFS
这回终于通过Judge Large了。
一种更快的解决方案
下面再介绍一种更快的解决方案,思路及代码来自niaokedaoren的博客。
前一个解决方案虽然能通过大数据集测试,但是为了保存路径信息我们额外引入了一个结构体而且因为需要用到指针使用了大量的new操作。还有什么不用保存所有路径信息的办法?
niaokedaoren的方案中使用了一个前驱单词表,即记录每一个单词的前驱单词是哪些。这样在遍历完毕后,我们从end出发递归就能把所有路径生成出来。但是由于前驱单词表不能记录当前的层次信息,似乎我们没法完成去重的工作。这个方案的巧妙之处就在于它没有使用我们通常的队列保存待处理的单词,一个单词一个单词先进先出处理的方法,而是使用两个vector来模拟队列的操作。我们从vector 1中遍历单词进行转换尝试,发现能转换的单词后将其放入vector 2中。当vector 1中的单词处理完毕后即为一层处理完毕,它里面的单词就可以从字典里删去了。接着我们对vector 2进行同样处理,如此反复直到当前处理的vector中不再有单词。我们发现vector 1和vector 2在不断地交换正处理容器和待处理容器的身份,因此可以通过将其放入一个数组中,每次循环对数组下标值取反实现身份的交替:
int current = 0;
int previous = 1;
循环
current = !current; previous = !previous;
......
循环结束
完全代码如下:
1 class Solution { 2 public: 3 std::vector<std::vector<std::string> > findLadders(std::string start, std::string end, std::unordered_set<std::string> &dict) 4 { 5 6 result_.clear(); 7 std::unordered_map<std::string, std::vector<std::string>> prevMap; 8 9 for(auto iter = dict.begin(); iter != dict.end(); ++iter) 10 { 11 prevMap[*iter] = std::vector<std::string>(); 12 } 13 14 std::vector<std::unordered_set<std::string>> candidates(2); 15 16 int current = 0; 17 int previous = 1; 18 19 candidates[current].insert(start); 20 21 while(true) 22 { 23 current = !current; 24 previous = !previous; 25 26 for (auto iter = candidates[previous].begin(); iter != candidates[previous].end(); ++iter) 27 { 28 dict.erase(*iter); 29 } 30 31 candidates[current].clear(); 32 33 for(auto iter = candidates[previous].begin(); iter != candidates[previous].end(); ++iter) 34 { 35 for(size_t pos = 0; pos < iter->size(); ++pos) 36 { 37 std::string word = *iter; 38 for(int i = 'a'; i <= 'z'; ++i) 39 { 40 if(word[pos] == i) 41 { 42 continue; 43 } 44 45 word[pos] = i; 46 47 if(dict.count(word) > 0) 48 { 49 prevMap[word].push_back(*iter); 50 candidates[current].insert(word); 51 } 52 } 53 } 54 } 55 56 if (candidates[current].size() == 0) 57 { 58 return result_; 59 } 60 if (candidates[current].count(end)) 61 { 62 break; 63 } 64 } 65 66 67 std::vector<std::string> path; 68 GeneratePath(prevMap, path, end); 69 70 return result_; 71 } 72 73 private: 74 void GeneratePath(std::unordered_map<std::string, std::vector<std::string>> &prevMap, std::vector<std::string>& path, 75 const std::string& word) 76 { 77 if (prevMap[word].size() == 0) 78 { 79 path.push_back(word); 80 std::vector<std::string> curPath = path; 81 reverse(curPath.begin(), curPath.end()); 82 result_.push_back(curPath); 83 path.pop_back(); 84 return; 85 } 86 87 path.push_back(word); 88 for (auto iter = prevMap[word].begin(); iter != prevMap[word].end(); ++iter) 89 { 90 GeneratePath(prevMap, path, *iter); 91 } 92 path.pop_back(); 93 } 94 95 std::vector<std::vector<std::string>> result_; 96 }; 97 98 niaokedaoren的方案
可以看到处理速度快了不少: