最长公共子串(LCS:Longest Common Substring)
最长公共子串(LCS:Longest Common Substring)是一个非常经典的面试题目,本人在乐视二面中被面试官问过,惨败在该题目中。
什么是最长公共子串
最长公共子串问题的基本表述为:给定两个字符串,求出它们之间最长的相同子字符串的长度。
最直接的解法就是暴力解法:遍历所有子字符串,比较它们是否相同,然后去的相同子串中最长的那个。对于长度为n的字符串,它子串的数量为n(n-1)/2,假如两个字符串长度均为n,那么该解法的复杂度为O(n^4),想想并不是取出所有的子串,那么该解法的复杂度为O(n^3)。
复杂度太高,可以进行优化,可以利用动态规划法(有重叠的子问题)。
暴力解法
对于该问题,直接的思路就是要什么就找什么,要子串就要子串,要相同就比较每个字符,要长度就计算长度,所以很容易写出下列代码:
//暴力
public static int longestCommonSubstring(String s1, String s2){
char[] str1 = s1.toCharArray();
char[] str2 = s2.toCharArray();
int str1_length = str1.length;
int str2_length = str2.length;
if(str1_length == 0 || str2_length == 0)
return 0;
//最大长度
int maxLength = 0;
int compareNum = 0;
int start1 = -1;
int start2 = -1;
for(int i=0;i<str1_length;i++){
for(int j=0;j<str2_length;j++){
int m = i;
int n = j;
//相同子串长度
int length = 0;
while(m < str1_length && n < str2_length){
compareNum++;
if(str1[m] != str2[n])
break;
m++;
n++;
length++;
}
if(length > maxLength){
maxLength = length;
start1 = i + 1;
start2 = j + 1;
} }
}
System.out.println("比较次数" + compareNum + ",s1起始位置:" + start1 + ",s2起始位置:" + start2);
return maxLength;
}
该思路以字符串中每个字符作为子串的开始,判断以此开始的子串的相同字符所能达到的最大长度。从上述代码来看,复杂度是O(n^2),但是在比较两个相同开端的子串的效率不是O(1),是O(n),所以上述算法的复杂度为O(n^3)。
动态规划-空间换时间
上述解法回答面试官,面试官肯定会让你优化!
我们发现,在相同开端的子串的比较中,有很多事重复动作。比如在比较以i,j分别为起点的子串时,有可能会进行i+1和j+1以及i+2和j+2位置的字符的比较。而以i+1,j+1分别为起点的子串时,这些字符又被比较了一次。也就说该问题有非常相似的子问题,而子问题之间又有重叠,这就给动态规划法创造了契机。
暴力解法是以子串开端开始寻找,现在换个思路,以相同子串的字符结尾来利用动态规划法。
假设两个字符串分别为A、B,A[i]和B[j]分别表示其第i和j个字符,再假设K[i,j]表示以A[i]和B[j]结尾的子串的最大长度。那么A,B分别再向下走一个字符,我们可以推断出K[i+1,j+1]与K[i,j]之间的关系,如果A[i] == B[j],那么K[i+1,j+1] = K[i,j] + 1;否则K[i+1,j+1] =0。而如果A[i+1]
和B[j+1]
相同,那么就只要在以A[i]
和B[j]
结尾的最长相同子串之后分别添上这两个字符即可,这样就可以让长度增加一位,综上所述,就是K[i+1,j+1] = (A[i] == B[j] ? K[i,j] + 1 : 0)的关系。
由上述K[i+1,j+1] = (A[i] == B[j] ? K[i,j] + 1 : 0)的关系,想到了使用二维数组来存储两个字符串之间的相同子串关系,因为K[i+1,j+1] = (A[i+1] == B[j+1] ? K[i,j] + 1 : 0)关系,只计算二维数据的最上列和最左列数值即可,其他数值通过K[i+1,j+1] = (A[i+1] == B[j+1] ? K[i,j] + 1 : 0)可得。如下图所示:
代码如下:
//优化
public static int longestCommonSubstring1(String s1, String s2){
if(s1.length() == 0 || s2.length() == 0)
return 0;
char[] str1 = s1.toCharArray();
char[] str2 = s2.toCharArray();
int start1 = -1;
int start2 = -1;
int[][] results = new int[str2.length][str1.length];
//最大长度
int maxLength = 0;
int compareNum = 0;
for(int i=0;i<str1.length;i++){
results[0][i] = (str2[0] == str1[i] ? 1 : 0);
compareNum++;
for(int j=1;j<str2.length;j++){
results[j][0] = (str1[0] == str2[j] ? 1 : 0);
if(i>0 && j>0){
if(str1[i] == str2[j]){
results[j][i] = results[j-1][i-1] + 1;
compareNum++;
}
}
if(maxLength < results[j][i]){
maxLength = results[j][i];
start1 = i - maxLength + 2;
start2 = j - maxLength + 2;
}
}
}
System.out.println("比较次数" + (compareNum+str2.length) + ",s1起始位置:" + start1 + ",s2起始位置:" + start2);
return maxLength;
}
用二维数组保存计算结果,避免了重复计算,运算的时间复杂度降低到了O(n^2)。
最长公共子串(LCS:Longest Common Substring)的更多相关文章
- 最长公共子串算法(Longest Common Substring)
给两个字符串,求两个字符串的最长子串 (例如:"abc""xyz"的最长子串为空字符串,"abcde"和"bcde"的最 ...
- 动态规划之最长公共子序列LCS(Longest Common Subsequence)
一.问题描述 由于最长公共子序列LCS是一个比较经典的问题,主要是采用动态规划(DP)算法去实现,理论方面的讲述也非常详尽,本文重点是程序的实现部分,所以理论方面的解释主要看这篇博客:http://b ...
- 动态规划求最长公共子序列(Longest Common Subsequence, LCS)
1. 问题描述 子串应该比较好理解,至于什么是子序列,这里给出一个例子:有两个母串 cnblogs belong 比如序列bo, bg, lg在母串cnblogs与belong中都出现过并且出现顺序与 ...
- 后缀自动机(SAM) :SPOJ LCS - Longest Common Substring
LCS - Longest Common Substring no tags A string is finite sequence of characters over a non-empty f ...
- spoj 1811 LCS - Longest Common Substring (后缀自己主动机)
spoj 1811 LCS - Longest Common Substring 题意: 给出两个串S, T, 求最长公共子串. 限制: |S|, |T| <= 1e5 思路: dp O(n^2 ...
- 【SP1811】LCS - Longest Common Substring
[SP1811]LCS - Longest Common Substring 题面 洛谷 题解 建好后缀自动机后从初始状态沿着现在的边匹配, 如果失配则跳它的后缀链接,因为你跳后缀链接到达的\(End ...
- spoj1811 LCS - Longest Common Substring
地址:http://www.spoj.com/problems/LCS/ 题面: LCS - Longest Common Substring no tags A string is finite ...
- 最长公共子串LCS(Longest Common Substring)
一.问题描述 寻求两个字符串中的最大公共字串,其中子串是指字符串中连续的字符组成的,而不是像子序列,按照字符的前后顺序组成.如str1="sgabacbadfgbacst",str ...
- 「双串最长公共子串」SP1811 LCS - Longest Common Substring
知识点: SAM,SA,单调栈,Hash 原题面 Luogu 来自 poj 的双倍经验 简述 给定两字符串 \(S_1, S_2\),求它们的最长公共子串长度. \(|S_1|,|S_2|\le 2. ...
随机推荐
- drupal7 获取profile2模块自定义字段的值
$user=user_load($uid); $student=profile2_load_by_user($user,'student'); 这个函数官方有文档,通过用户对象返回用户的profile ...
- python学习笔记之——python安装mysqldb后,pycharm导入还是报错问题
在安装mysqldb过程中遇到,本来已经安装了mysqldb了,但是在pycharm中import MySQLdb还是报错找不到该模块的问题.解决方法如下:1.file->settings ...
- Nginx控制并发连接数
ngx_http_limit_conn_module这个模块用于限制每个定义的key值的连接数,特别是单IP的连接数. 不是所有的连接数都会被计数.一个符合计数要求的连接是整个请求头已经被读取的连接. ...
- android:首页点击返回键,两秒内再次点击退出系统
//记录用户首次点击返回键的时间 private long firstTime = 0; /** * 通过监听keyUp 实现双击返回键退出程序 * @param keyCode * @param e ...
- FileWriter剖析
集合这种容器存储数据,它只能在内存中临时存储,不能永久存储,这样会导致数据的丢失,所以出现了IO流. IO流用来处理设备之间的数据传输.可以用来做复制文件,上传文件,下载文件. 读数据是输入流,写数据 ...
- AndroidKiller报.smali文件丢失问题解决(关闭Android Studio的Instant Run)
第一节编写一个Android程序里我们生成了一个验证激活码的apk,当我们输入的激活码正确时才能注册成功,输入错误时注册失败. 现在我们想输入错误的激活码也能注册.我们用Android反编译工具进行反 ...
- Android--根据子控件的大小自动换行的ViewGroup
1.自定义ViewGroup /** * Created by Administrator on 2016/2/26. * * --------自动换行的ViewGroup----------- */ ...
- 【Python】pydot安装失败解决方法
使用keras时输出网络结构需要用到pydot,总是安装失败,最后按照下面这样的步骤成功了. 1.安装graphviz:pip install graphviz 2.安装graphviz软件,地址在: ...
- 《细说PHP》第二版--读书笔记
第五章 PHP的基本语法 5.2.4 在程序中使用空白的处理 5.3 变量 5.3.1 变量的声明 在php中变量的声明必须是使用一个$符号,后面跟变量名来表示 unset()函数释放指定变量 iss ...
- sqlserver性能调优中的逻辑读,物理读,预读是什么意思
表 'T_EPZ_INOUT_ENTRY_DETAIL'.扫描计数 1,逻辑读 4825 次,物理读 6 次,预读 19672 次.SQL SERVER 数据库引擎当遇到一个查询语句时,SQL SER ...