LeetCode-Word Break II -断词-DP优化

https://oj.leetcode.com/problems/word-break-ii/

首先这个问题显然是可以利用以前搜索的结果,所以可以看出是一个具有DP性质的递推关系的题目。

f(int p):后n-p个单词已经被断句的条件下,前p个所有组成的断句结果都有哪些,我们还需要一个数组dpf[],来保存前p个字符能不能被断句用以判断。

如果按着这个思路直接DP会超时,超时原因主要有两个:

1)对每个位置,可能dp[p]需要存储大量的字符串,而每个字符串都是s的一部分,其实可以用s的一系列索引来代替。

2)我们其实只需要dp[n]的所有结果,而这个结果中路径的存在建立在前面的子问题dp[j]都合法存在的情况下。所以其实可以先计算出dp[p]是否能被断句,不能的话就没必要构造dp[p]了。

这样两个优化能够过了所有CASE。

const int MAX_N=1000;
class Solution {
public:
	int m,n;
	vector <vector<int>>	dp[MAX_N];
	bool					dpf[MAX_N];
	void ConCat(vector<vector<int>> &res,vector <vector<int>> &prevs,int cur){
		for (int i=0;i<prevs.size();i++){
			vector<int> temp=prevs[i];
			temp.push_back(cur);
			res.push_back(temp);
		}
	}
	vector<string> wordBreak(string s, unordered_set<string> &dict) {
		memset(dpf,0,sizeof(dpf));
		n=s.length();
		dpf[0]=true;
		for(int i=1;i<=n;i++){          //dp figure out whether sequence before one pos can be break
			for (int j=0;j<i;j++){
				string cur=s.substr(j,i-j);
				if (dict.find(cur)!=dict.end()){
					dpf[i]|=dpf[j];
				}
			}
		}
		vector <string> res;
		if (!dpf[n]){
			return res;
		}
		dp[0].push_back(vector<int>(1,0));
		for(int i=1;i<=n;i++){
			if (!dpf[i]){continue;}
			for (int j=0;j<i;j++){
				if (!dpf[j]){continue;}
				string cur=s.substr(j,i-j);
				if (dict.find(cur)!=dict.end()){//we only concat the 'can break' sequences
					ConCat(dp[i],dp[j],i);
				}
			}
		}
		res.resize(dp[n].size(),"");
		for (int i=0;i<dp[n].size();i++){
			for (int j=0;j<dp[n][i].size()-1;j++){
				string temp=s.substr(dp[n][i][j],dp[n][i][j+1]-dp[n][i][j]);
				if (j>0){res[i]+=" ";}
				res[i]+=temp;
			}
		}
		return res;
	}
};

  

posted @ 2014-10-03 14:51  zombies  阅读(228)  评论(0编辑  收藏  举报