近期,我在网上看了一些动态规划求字符串最长公共子序列的代码。可是无一例外都是处理英文字符串,当处理汉字字符串时。常常会出现乱码或者不对的情况。

我对代码进行了改动。使用wchar_t类型存储字符串,可以正确的处理英文字符串和汉字字符串的最长公共子序列。

代码例如以下:

#include "stdafx.h"
#include <iostream>
#define N 1000
using namespace std;
//str1存储字符串1,str2存储字符串2
wchar_t str1[N],str2[N];
//lcs存储最长公共子序列
wchar_t lcs[N];
//c[i][j]存储str1[1...i]与str2[1...j]的最长公共子序列的长度
int c[N][N];
//flag[i][j]标记是那种子问题
//flag[i][j]==0为str1[i]==str2[j]
//flag[i][j]==1为c[i-1][j]>=s[i][j-1]
//flag[i][j]==-1为c[i-1][j]<s[i][j-1]
int flag[N][N];
//
int getLCSlength(const wchar_t *s1, const wchar_t *s2)
{
	int i;
	int len1 = wcslen(s1);
	int len2 = wcslen(s2);
	for(i=1;i<=len1;i++)
		c[i][0] = 0;
	for(i=0;i<=len2;i++)
		c[0][i] = 0;
	int j;
	for(i=1;i<=len1;i++)
		for(j=1;j<=len2;j++)
		{
			if(s1[i-1]==s2[j-1])
			{
				c[i][j] = c[i-1][j-1] +1;
				flag[i][j] = 0;
			}
			else if(c[i-1][j]>=c[i][j-1])
			{
				c[i][j] = c[i-1][j];
				flag[i][j] = 1;
			}
			else
			{
				c[i][j] = c[i][j-1];
				flag[i][j] = -1;
			}
		}
		return c[len1][len2];
}
wchar_t* getLCS(const wchar_t *s1, const wchar_t *s2,int len,wchar_t *lcs)
{
	int i = wcslen(s1);
	int j = wcslen(s2);
	while(i&&j)
	{
		if(flag[i][j]==0)
		{
			lcs[--len] = s1[i-1];
			i--;
			j--;
		}
		else if(flag[i][j]==1)
			i--;
		else
			j--;
	}
	return lcs;
}
int main(int argc, wchar_t* argv[])
{
	//本函数用来配置地域的信息,设置当前程序使用的本地化信息
	setlocale(LC_ALL,"chs");
	int cases;
	cout<<"请输入案例的个数:"<<endl;
	cin>>cases;
	while(cases--)
	{
		int i;
		cout<<"请输入字符串1:"<<endl;
		wcin>>str1;
		cout<<"请输入字符串2:"<<endl;
		wcin>>str2;
		int lcsLen = getLCSlength(str1,str2);
		cout<<"最长公共子序列长度:"<<lcsLen<<endl;
		wchar_t *p = getLCS(str1,str2,lcsLen,lcs);
		cout<<"最长公共子序列为:"<<endl;
		for(i=0;i<lcsLen;i++)
			wcout<<lcs[i];
		wcout<<endl;
	}

	return 0;
}

posted on 2017-06-26 10:42  lxjshuju  阅读(344)  评论(0编辑  收藏  举报