Longest Common Substring

  • Brute Force

    遍历ab所有位置的组合,向后延伸,直到遇到两个不同的字符,复杂度是\(n^3\)级别。
class Solution {
public:
// 返回所有结果
vector<string> longestCommonSubstring(string& a, string& b) {
vector<string> ans;
int maxLen = 0;
for (int i = 0; i < a.size(); ++i) {
for (int j = 0; j < b.size(); ++j) {
string cur;
for (int m = i, n = j; m < a.size() && n < b.size(); ++m, ++n) {
if (a[m] != b[n]) {
break;
}
cur += a[m];
}
if (cur.size() && cur.size() >= maxLen) {
maxLen = cur.size();
ans.push_back(cur);
}
}
}
return ans;
}
};
  • DP

    暴力解有很多重复计算:比如以\(i\)和\(j\)为起点去向后延伸,我们可能需要比较\(i+1\)和\(j+1\)、\(i+2\)和\(j+2\)...而以\(i+1\)和\(j+1\)为起点时,仍然要比较\(i+2\)和\(j+2\),重叠子问题给动态规划带来了可能。

    暴力做法是将每个\(i\)和\(j\)作为起点,现在我们考虑将\(i\)和\(j\)作为终点,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的相同子串的最大长度,很快就可以推出:

\[L(i,j)=
\begin{cases}
1+L(i-1,j-1)& \text{a[i]=b[j]}\\
0& \text{a[i]!=b[j]}
\end{cases}\]

为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。

class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
vector<vector<int>> L(1 + a.size(), vector<int>(1 + b.size(), 0));
int maxLen = 0; for (int i = 1; i <= a.size(); ++i) {
for (int j = 1; j <= b.size(); ++j) {
if (a[i - 1] == b[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = 0;
}
maxLen = max(maxLen, L[i][j]);
}
} return maxLen;
}
};

显然时间降为\(O(n^2)\),空间升为\(O(n^2)\)。仔细观察,计算\(L(i,j)\)只需要左上方\(L(i-1,j-1)\)的信息,所以我们按照斜线方向计算,可以将空间优化到\(O(1)\):

class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
// from the up-right corner
int row = 0, col = b.size() - 1;
int maxLen = 0; while (row < a.size()) {
int curLen = 0;
for (int i = row, j = col; i < a.size() && j < b.size(); ++i, ++j) {
if (a[i] == b[j]) {
++curLen;
}
else {
curLen = 0;
}
maxLen = max(maxLen, curLen);
}
if (col > 0) {
--col; // 斜线左移
}
else {
++row; // 斜线下移
}
} return maxLen;
}
};

(TODO)输出所有的最长公共子串

Longest Common Subsequence

  • Brute Force

    找到a的所有子序列,判断是否是b的子序列,指数级复杂度,也就没有写出来的必要了。
  • DP

    重叠子问题很明显,而且LCS具有最优子结构,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的LCS长度:

\[L(i,j)=
\begin{cases}
1+L(i-1,j-1)& \text{a[i]=b[j]}\\
max\{L(i-1,j),L(i,j-1)\}& \text{a[i]!=b[j]}
\end{cases}\]

为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。

class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
vector<vector<int>> L(m + 1, vector<int>(n + 1, 0));
int ans = 0;
for(int i = 1;i <= m;++i) {
for(int j = 1;j <= n;++j) {
if(text1[i - 1] == text2[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = max(L[i - 1][j], L[i][j - 1]);
}
ans = max(ans, L[i][j]);
}
} return ans;
}
};

时间和空间都是\(O(mn)\)。类似的,\(L(i,j)\)依赖于左上角\(L(i-1,j-1)\)、左边\(L(i,j-1)\)、上边\(L(i-1,j)\),可以只存储上一行和当前行的\(L\)。进一步考虑:可以只存储当前行的\(L\),外加一个变量\(pre\)存储左上角\(L(i-1,j-1)\),空间可以优化到\(O(min(m,n))\):

class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
if(m < n) {
return longestCommonSubsequence(text2, text1);
} vector<int> curRow(n + 1, 0);
int pre = 0, ans = 0;
for(int i = 1;i <= m;++i) {
pre = curRow[0];
for(int j = 1;j <= n;++j) {
int tmp = curRow[j];
if(text1[i - 1] == text2[j - 1]) {
curRow[j] = 1 + pre;
}
else {
curRow[j] = max(curRow[j], curRow[j - 1]);
}
ans = max(ans, curRow[j]);
pre = tmp;
}
} return ans;
}
};

(TODO)输出所有的最长公共子串

Longest Increasing Subsequence

  • DP

    \(dp[i]\)表示只考虑\(i\)及之前的信息,所形成的LIS的长度:

\[dp[i]=
\begin{cases}
1+max\{dp[j]\}, 0 \leq j<i& \text{a[i]>a[j]}\\
max\{dp[j])\}, 0 \leq j<i& \text{a[i]$\leq$a[j]}
\end{cases}\]

最终答案即是\(dp\)数组的最大值:

class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
if(!nums.size()) {
return 0;
}
vector<int> dp(nums.size(), 1);
int ans = 1; for(int i = 1;i < nums.size();++i) {
int curMax = 0;
for(int j = 0;j < i;++j) {
if(nums[i] > nums[j]) {
curMax = max(curMax, dp[j]);
}
}
dp[i] = 1 + curMax;
ans = max(ans, dp[i]);
} return ans;
}
};

时间\(O(n^2)\),空间\(O(n)\)。

  • DP+Binary Search

    遍历数组的过程中,不停填充\(dp\)数组,维护\(dp\)数组使得其存储递增序列:

    如果\(nums[i]<dp[0]\),更新\(dp[0]\);

    如果\(nums[i]>dp[len]\),\(++len\),并且存入\(nums[i]\);

    如果\(nums[i]\)介于\(dp\)中间,就二分查找\(nums[i]\)的位置,并更新相应的\(dp\)值。

    举例来说,\(nums=[0,8,4,12,2]\),\(dp\)数组:

    \([0]\)

    \([0,8]\)

    \([0,4]\)

    \([0,4,12]\)

    \([0,2,12]\)

    虽然\(dp\)数组最终存储的不是LIS,但长度确是LIS的长度:
class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
const int n = nums.size();
if(0 == n)
return 0; vector<int> dp(n);
dp[0] = nums[0];
int len = 0;
for(int i = 1;i < n;++i) {
if(nums[i] < dp[0]) {
dp[0] = nums[i];
}
else if(nums[i] > dp[len]) {
dp[++len] = nums[i];
}
else {
int index = biSearch(dp, 0, len, nums[i]);
dp[index] = nums[i];
}
}
return len + 1;
}
private:
int biSearch(vector<int>& nums, int l, int r, int target) {
while(l < r) {
int m = l + (r - l) / 2;
if(nums[m] == target) {
return m;
}
if(target > nums[m]) {
l = m + 1;
}
else {
r = m;
}
}
return l;
}
};

时间\(O(nlgn)\),空间\(O(n)\)。

Longest Palindromic Substring

  • Brute Force

    枚举每个子串的起始和结束位置,判断是否回文。时间\(O(n^3)\),空间\(O(1)\)。
  • DP

    假设输入ababa,如果我们已经判断了bab是回文的,那么ababa就不需要再扫描一遍,因为两端都是a

    所以一个很直观的动规:

    令\(dp(i,j)\)去记忆\(i\)和\(j\)之间的串是否回文,那么转移方程:

\[dp(i,j)=dp(i+1,j-1)\&\&s[i]=s[j]
\]

边界条件\(dp(i,i)=true,dp(i,i+1)=(s[i]=s[i+1])\):

// 填充方向:由边界条件dp(i,i)向其他地方扩展,只需要填充j>i的三角形部分
class Solution {
public:
string longestPalindrome(string s) {
vector<vector<bool>> dp(s.length() + 1, vector<bool>(s.length() + 1, false));
int start = 0, end = 0;
int maxLen = 1;
for (int i = 0; i < s.length(); ++i) {
dp[i][i] = true;
if (i < s.length() - 1) {
if (s[i] == s[i + 1]) {
dp[i][i + 1] = true;
start = i;
end = i + 1;
}
else {
dp[i][i + 1] = false;
}
}
} for (int i = s.length() - 1; i >= 0; --i) {
for (int j = i + 2; j < s.length(); ++j) {
if (s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1];
if (dp[i][j] && maxLen < j - i + 1) {
start = i;
end = j;
maxLen = end - start + 1;
}
}
else {
dp[i][j] = false;
}
}
}
return s.substr(start, end - start + 1);
}
};

时间\(O(n^2)\),空间\(O(n^2)\)。

  • Expand Around Center

    回文串都是镜像对称的,可以遍历整个串,从当前位置向两边延伸,直到遇到不相等的字母。这里要考虑字符串长度的奇偶:
class Solution {
public:
string longestPalindrome(string s) {
const int n = s.length();
if (!n)
return ""; int start = 0, end = 0;
for (int i = 0; i < n; ++i) {
int len1 = expandCenter(s, i, i);
int len2 = expandCenter(s, i, i + 1);
int len = max(len1, len2);
if (len > end - start + 1) {
start = i - (len - 1) / 2;
end = i + len / 2;
}
}
return s.substr(start, end - start + 1);
}
private:
int expandCenter(string s, int start, int end) {
while (start >= 0 && end < s.length() && s[start] == s[end]) {
--start;
++end;
}
return end - start - 1;
}
};

时间\(O(n^2)\),空间\(O(1)\)。

  • Manacher's Algorithm(待填)

    时间\(O(n)\)。

Longest Palindromic Subsequence

  • DP

    令\(dp(i,j)\)表示介于\(i\)和\(j\)间的LPS的长度,那么状态转移方程:

\[dp(i,j)=
\begin{cases}
2+dp(i+1,j-1)& \text{s[i]=s[j]}\\
max\{dp(i+1,j),dp(i,j-1)\}& \text{s[i]$\neq$s[j]}
\end{cases}\]

class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
} vector<vector<int>> dp(n, vector<int>(n, 0));
int ans = 1;
for(int i = n - 1;i >= 0;--i) {
for(int j = i;j < n;++j) {
if(i == j) {
dp[i][j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1] + 2;
}
else {
dp[i][j] = max(dp[i + 1][j], dp[i][j - 1]);
}
ans = max(ans, dp[i][j]);
}
} return ans;
}
};

时间\(O(n^2)\),空间\(O(n^2)\)。

同样,空间可以优化到\(O(n)\)。

class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
} vector<int> dp(n, 0);
int ans = 1, pre = 0;
for(int i = n - 1;i >= 0;--i) {
pre = dp[0];
for(int j = i;j < n;++j) {
int tmp = dp[j];
if(i == j) {
dp[j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[j] = pre + 2;
}
else {
dp[j] = max(dp[j - 1], dp[j]);
}
pre = tmp;
ans = max(ans, dp[j]);
}
} return ans;
}
};

Longest XXX的更多相关文章

  1. Linux 日志报错 xxx blocked for more than 120 seconds

    监控作业发现一台服务器(Red Hat Enterprise Linux Server release 5.7)从凌晨1:32开始,有一小段时间无法响应,数据库也连接不上,后面又正常了.早上检查了监听 ...

  2. 记一个mvn奇怪错误: Archive for required library: 'D:/mvn/repos/junit/junit/3.8.1/junit-3.8.1.jar' in project 'xxx' cannot be read or is not a valid ZIP file

    我的maven 项目有一个红色感叹号, 而且Problems 存在 errors : Description Resource Path Location Type Archive for requi ...

  3. LeetCode[3] Longest Substring Without Repeating Characters

    题目描述 Given a string, find the length of the longest substring without repeating characters. For exam ...

  4. 最长回文子串-LeetCode 5 Longest Palindromic Substring

    题目描述 Given a string S, find the longest palindromic substring in S. You may assume that the maximum ...

  5. [LeetCode] Longest Substring with At Least K Repeating Characters 至少有K个重复字符的最长子字符串

    Find the length of the longest substring T of a given string (consists of lowercase letters only) su ...

  6. eclipse 突然 一直在loading descriptor for XXX (XXX为工程名)Cancel Requested

    问题: eclipse 启动后,啥也不干,就一直在loading descriptor for XXX (XXX为工程名),,其他什么操作都不能操作. 如下图所示,保存文件也无法保存.  这个怎么办? ...

  7. leetcode--5. Longest Palindromic Substring

    题目来自 https://leetcode.com/problems/longest-palindromic-substring/ 题目:Given a string S, find the long ...

  8. 现有语言不支持XXX方法

    史上最强大的IDE也会有bug的时候哈,今天遇到这个问题特别郁闷,百度了下,果然也有人遇到过这个问题 解决方法: 1.调用的时候参数和接口声明的参数不一致(检查修改) 2.继承接口中残留一个废弃的方法 ...

  9. An App ID with Identifier 'com.XXX.XXX’ is not available. Please enter a different string.报错

    昨天刚刚升的Xcode7.3和iOS9.3,然后没怎么使用这两样就下班了,但是今天早上来了之后,就发现突然之间不能真机测试和运行代码了,一看才发现xcode报错: An App ID with Ide ...

随机推荐

  1. CF633(div.2)C. Powered Addition

    题目描述 http://codeforces.com/contest/1339/problem/C 给定一个长度为 \(n\) 的无序数组,你可以在第 \(x\) 秒进行一次下面的操作. 从数组选取任 ...

  2. 【Mongodb】聚合查询 && 固定集合

    概述 数据存储是为了可查询,统计.若数据只需存储,不需要查询,这种数据也没有多大价值 本篇介绍Mongodb 聚合查询(Aggregation) 固定集合(Capped Collections) 准备 ...

  3. wireshark抓包实战(二),第一次抓包

    1.选择网卡. 因为wireshark是基于网卡进行抓包的,所以这时候我们必须选取一个网卡进行抓包.选择网卡一般有三种方式 (1)第一种 当我们刚打开软件是会自动提醒您选择,例如: (2)第二种 这时 ...

  4. Linux命文件与目录属性

    一.linux系统中文件标志 d ===> 目录 - ===> 文件 l ===> 连接文件 b ===> 可供存储设备文件 c ===> 串形端口设备文件(鼠标,键盘) ...

  5. redis 非关系型数据库

    redis 类型,数据存在磁盘里面,所以存储速度比较快,其他数据类型还是存储在数据库所以比较慢些 链接redis数据库: r=redis.Redis(host="%%%%%%%", ...

  6. 使用spring连接mysql数据库出错

    最近在学习spring框架,但是在学到JdbcTemplate时连接数据库一直报错,百度谷歌各种查找都能没有解决问题,简直要癫狂,报错信息如下: org.springframework.jdbc.Ca ...

  7. GeoGebra的一些指令名字

    列举出老师上课提出的一些命令 比较不常见的命令 1.取得函数上一点的坐标值x(A).y(A).z(A) 2.复数指令real() imaginary() 复数中的虚数应该使用Alt+i打出 点的表示指 ...

  8. python的多线程、多进程、协程用代码详解

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:刘早起早起 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...

  9. C. 无穷的小数

    单点时限: 1.0 sec 内存限制: 512 MB 在十进制下,我们能够很轻易地判断一个小数的位数是有穷的或无穷的,但是把这个小数用二进制表示出的情况下其有穷性和无穷性就会发生改变,比如 十进制下的 ...

  10. CSS 中你应该了解的 BFC

    我们常说的文档流其实分为定位流.浮动流和普通流三种.而普通流其实就是指BFC中的FC.FC是formatting context的首字母缩写,直译过来是格式化上下文,它是页面中的一块渲染区域,有一套渲 ...