LCS(最长公共字串)
/* * LCS(最长公共字串)就是两个字符串中找出连续的最长公共的字符串 * 我们可以建立一个矩阵来比较两个字符串相对应位置字符的匹配情况,若是匹配就设置为1,不匹配就设置为0 * 如下:假设有两个字符串为:str1:abc str2:bc * 建立矩阵 * a b c * b 0 1 0 * c 0 0 1 * 只要求出由1构成的斜线最长的那个就是最长公共字串,但是这里有一个问题,怎么快速的找到由1构成的最长斜线? * 在这里采用DP的思想,那么此处的包含str1[i] 和 str2[j]公共子串的长度必然是包含str1[i-1]和str2[j-1]的公共子串的长度加1, * 还是上面两个字符串,改进之后变成 * a b c * b 0 1 0 * c 0 0 2 * 当最后要找出最长字串的时候,只要标记最长字串的个数,还有就是标记,最长字串的下标 * 就可以找到最长字串的起始位置和结束位置 * 如上所示,这里的最长字串的个数为max=2,下标为index=2(这里以str1为例) * 那么可以建立一个辅助的字符数组c * 字符数组的第一个字符就是 str1的第index-max+1+i=2-2+1+0=1 * 之后再对i进行递增,结束条件为i<max * * */ import java.util.List; public class LCS { public List<String> getSameString(String str1,String str2) { char[] charStr1 = str1.toCharArray(); //字符串转为字符数组 char[] charStr2 = str2.toCharArray(); int[][] arr = new int[charStr1.length][charStr2.length];//建立二维矩阵 //两个字符串的长度,选取最小的那一个,因为最长公共字串不可能比最小的那个还长 int len =charStr1.length<charStr2.length?charStr1.length:charStr2.length; char[] str=new char[len]; int index=0; //保存最长字串的下标 int max=0; //保存最长字串的个数 for(int i=0;i<charStr1.length;i++) { for(int j=0;j<charStr2.length;j++) { if(charStr1[i]==charStr2[j]) { if(i==0 || j==0) { arr[i][j]=1; if(max==0) { max=1; index=i; } } else { arr[i][j]=arr[i-1][j-1]+1; if(max<arr[i][j]) { max=arr[i][j]; index=i; } } } else { arr[i][j]=0; } } } for(int i=0;i<charStr1.length;i++) { for(int j=0;j<charStr2.length;j++) { System.out.print(" "+arr[i][j]); } System.out.println(); } for(int k=0;k<max;k++) { str[k]=charStr1[index-max+1+k]; } System.out.println(str); return null; } public static void main(String[] args) { // TODO Auto-generated method stub LCS lcs = new LCS(); lcs.getSameString("21232523311324", "312123223445"); } }
posted on 2014-09-16 16:10 daocaorendeshijie 阅读(248) 评论(0) 编辑 收藏 举报