求最长回文子串,O(n)复杂度
最长回文子串问题—Manacher算法
最长回文串问题是一个经典的算法题。
0. 问题定义
最长回文子串问题:给定一个字符串,求它的最长回文子串长度。
假设一个字符串正着读和反着读是一样的,那它就是回文串。以下是一些回文串的实例:
12321 a aba abba aaaa tattarrattat(牛津英语词典中最长的回文单词)
1. Brute-force解法
对于最长回文子串问题,最简单粗暴的办法是:找到字符串的全部子串,遍历每一个子串以验证它们是否为回文串。
一个子串由子串的起点和终点确定,因此对于一个长度为n的字符串,共同拥有n^2个子串。这些子串的平均长度大约是n/2。因此这个解法的时间复杂度是O(n^3)。
2. 改进的方法
显然全部的回文串都是对称的。长度为奇数回文串以最中间字符的位置为对称轴左右对称,而长度为偶数的回文串的对称轴在中间两个字符之间的空隙。可否利用这样的对称性来提高算法效率呢?答案是肯定的。我们知道整个字符串中的全部字符,以及字符间的空隙。都可能是某个回文子串的对称轴位置。能够遍历这些位置,在每一个位置上同一时候向左和向右扩展,直到左右两边的字符不同。或者达到边界。对于一个长度为n的字符串,这样的位置一共同拥有n+n-1=2n-1个。在每一个位置上平均大约要进行n/4次字符比較,于是此算法的时间复杂度是O(n^2)。
3. Manacher 算法
对于一个比較长的字符串,O(n^2)的时间复杂度是难以接受的。
Can we do better?
先来看看解法2存在的缺陷。
1)因为回文串长度的奇偶性造成了不同性质的对称轴位置。解法2要对两种情况分别处理。
2)非常多子串被反复多次訪问。造成较差的时间效率。
缺陷2)能够通过这个直观的小��体现:
char: a b a b a
i : 0 1 2 3 4
当i==1。和i==2时,左边的子串aba分别被遍历了一次。
假设我们能改善解法2的不足,就非常有希望能提高算法的效率。
Manacher正是针对这些问题改进算法。
(1) 解决长度奇偶性带来的对称轴位置问题。
Manacher算法首先对字符串做一个预处理。在全部的空隙位置(包含首尾)插入相同的符号。要求这个符号是不会在原串中出现的。这样会使得全部的串都是奇数长度的。
以插入#号为例:
aba ---> #a#b#a#
abba ---> #a#b#b#a#
插入的是相同的符号,且符号不存在于原串,因此子串的回文性不受影响。原来是回文的串,插完之后还是回文的,原来不是回文的,依旧不会是回文。
(2)解决反复訪问的问题。
我们把一个回文串中最左或最右位置的字符与其对称轴的距离称为回文半径。Manacher定义了一个回文半径数组RL,用RL[i]表示以第i个字符为对称轴的回文串的回文半径。
我们一般对字符串从左往右处理,因此这里定义RL[i]为第i个字符为对称轴的回文串的最右一个字符与字符i的距离。
对于上面插入分隔符之后的两个串,能够得到RL数组:
char: # a # b # a #
RL : 1 2 1 4 1 2 1
RL-1: 0 1 0 3 0 1 0
i : 0 1 2 3 4 5 6
char: # a # b # b # a #
RL : 1 2 1 2 5 2 1 2 1
RL-1: 0 1 0 1 4 1 0 1 0
i : 0 1 2 3 4 5 6 7 8
上面我们还求了一下RL[i]-1。
通过观察能够发现。RL[i]-1的值。正是在原本那个没有插入过分隔符的串中,以位置i为对称轴的最长回文串的长度。那么仅仅要我们求出了RL数组,就能得到最长回文子串的长度。
于是问题变成了,如何高效地求的RL数组。
基本思路是利用回文串的对称性,扩展回文串。
我们再引入一个辅助变量MaxRight
。表示当前訪问到的全部回文子串,所能触及的最右一个字符的位置。另外还要记录下MaxRight
相应的回文串的对称轴所在的位置。记为pos
。它们的位置关系例如以下。
imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" class="imagebubble-image" alt="" style="vertical-align:middle;border:0px;" />
我们从左往右地訪问字符串来求RL,假设当前訪问到的位置为i
,即要求RL[i],在相应上图,i
必定是在po
右边的(obviously)。
但我们更关注的是。i
是在MaxRight
的左边还是右边。我们分情况来讨论。
1)当i
在MaxRight
的左边;
情况1)能够用下图来刻画:
![](http://upload-images.jianshu.io/upload_images/1111151-c539f9e9d09d69b0.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
我们知道,图中两个红色块之间(包含红色块)的串是回文的;而且以i
为对称轴的回文串,是与红色块间的回文串有所重叠的。我们找到i
关于pos
的对称位置j
。这个j
相应的RL[j]
我们是已经算过的。
依据回文串的对称性,以i
为对称轴的回文串和以j
为对称轴的回文串,有一部分是相同的。这里又有两种细分的情况。
a. 以j
为对称轴的回文串比較短,短到像下图这样。
![](http://upload-images.jianshu.io/upload_images/1111151-01d9889ba9f867cb.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
这时我们知道RL[i]至少不会小于RL[j],而且已经知道了部分的以i
为中心的回文串,于是能够令RL[i]=RL[j]
。可是以i
为对称轴的回文串可能实际上更长,因此我们试着以i
为对称轴,继续往左右两边扩展,直到左右两边字符不同,或者到达边界。
b. 以j
为对称轴的回文串非常长,这么长:
![](http://upload-images.jianshu.io/upload_images/1111151-0f3ed33dabc8f37e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
这时,我们仅仅能确定,两条蓝线之间的部分(即不超过MaxRight的部分)是回文的。于是从这个长度開始,尝试以i
为中心向左右两边扩展,。直到左右两边字符不同,或者到达边界。
不论以上哪种情况,之后都要尝试更新MaxRight
和pos
,因为有可能得到更大的MaxRight。
详细操作例如以下:
step 1: RL[i] <--- min(RL[2*pos-i], MaxRight-i)
step 2: 以i为中心扩展回文串,直到左右两边字符不同。或者到达边界。
step 3: 更新MaxRight和pos
2)当i
在MaxRight
的右边。
![](http://upload-images.jianshu.io/upload_images/1111151-c123368366c0627a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
遇到这样的情况,说明以i
为对称轴的回文串还没有不论什么一个部分被訪问过。于是仅仅能从i
的左右两边開始尝试扩展了,当左右两边字符不同,或者到达字符串边界时停止。然后更新MaxRight
和pos
。
(3)算法实现
def manacher(s):
#预处理
s='#'+'#'.join(s)+'#'
RL=[0]*len(s)
MaxRight=0
pos=0
MaxLen=0
for i in range(len(s)):
if i<MaxRight:
RL[i]=min(RL[2*pos-i], MaxRight-i)
else:
RL[i]=1
#尝试扩展,注意处理边界
while i-RL[i]>=0 and i+RL[i]<len(s) and s[i-RL[i]]==s[i+RL[i]]:
RL[i]+=1
#更新MaxRight,pos
if RL[i]+i-1>MaxRight:
MaxRight=RL[i]+i-1
pos=i
#更新最长回文串的长度
MaxLen=max(MaxLen, RL[i])
return MaxLen-1
(4)复杂度分析
空间复杂度:插入分隔符形成新串。占用了线性的空间大小。RL数组也占用线性大小的空间,因此空间复杂度是线性的。
时间复杂度:虽然代码里面有两层循环,通过amortized analysis我们能够得出,Manacher的时间复杂度是线性的。因为内层的循环仅仅对尚未匹配的部分进行。因此对于每一个字符而言,仅仅会进行一次,因此时间复杂度是O(n)。
4. 很多其它关于回文串的fun facts(主要来自维基百科)
4.1 人们在一座名为赫库兰尼姆的古城遗迹中。找到了一个好玩的拉丁语回文串:sator arepo tenet opera
。翻译成中文大概就是`一个叫做Arepo的播种者。他用力地扶(把)着车轮。
rotas
这个串的每一个单词首字母刚好组成了第一个单词,每一个单词的第二个字母刚好组成了第二个单词...于是乎,假设写出酱紫,你会发现上下左右四个方向读起来是一样的。这个串被称为 Sator Square.
imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" class="imagebubble-image" alt="" style="vertical-align:middle;border:0px;" />
4.2 本文开头给出的单词tattarrattat
。出如今爱尔兰作家詹姆斯·乔伊斯的小说《尤利西斯》,是敲门的意思。吉尼斯纪录的最长回文英文单词是detartrated
,是个化学术语。另外。还有些已出版的英文回文小说(你们歪果仁真会玩),比方Satire:
Veritas,Dr Awkward & Olson in Oslo等。
能够採用动态规划,列举回文串的起点或者终点来解最长回文串问题。无需讨论串长度的奇偶性。
看以下的代码。easy理解。
public int longestPalindrome(String s) {
int n=s.length();
boolean[][] pal=new boolean[n][n];
//pal[i][j] 表示s[i...j]是否是回文串
int maxLen=0;
for (int i=0;i<n;i++){ // i作为终点
int j=i; //j作为起点
while (j>=0){
if (s.charAt(j)==s.charAt(i)&&(i-j<2||pal[j+1][i-1])){
pal[j][i]=true;
maxLen=Math.max(maxLen, i-j+1);
}
j--;
}
}
return maxLen;
}
求最长回文子串,O(n)复杂度的更多相关文章
- hdu 3068 最长回文(manachar求最长回文子串)
题目连接:hdu 3068 最长回文 解题思路:通过manachar算法求最长回文子串,如果用遍历的话绝对超时. #include <stdio.h> #include <strin ...
- PAT甲题题解-1040. Longest Symmetric String (25)-求最长回文子串
博主欢迎转载,但请给出本文链接,我尊重你,你尊重我,谢谢~http://www.cnblogs.com/chenxiwenruo/p/6789177.html特别不喜欢那些随便转载别人的原创文章又不给 ...
- Manacher模板( 线性求最长回文子串 )
模板 #include<stdio.h> #include<string.h> #include<algorithm> #include<map> us ...
- 求最长回文子串 - leetcode 5. Longest Palindromic Substring
写在前面:忍不住吐槽几句今天上海的天气,次奥,鞋子里都能养鱼了...裤子也全湿了,衣服也全湿了,关键是这天气还打空调,只能瑟瑟发抖祈祷不要感冒了.... 前后切了一百零几道leetcode的题(sol ...
- 后缀数组 - 求最长回文子串 + 模板题 --- ural 1297
1297. Palindrome Time Limit: 1.0 secondMemory Limit: 16 MB The “U.S. Robots” HQ has just received a ...
- Manacher算法 O(n) 求最长回文子串
转自:http://bbs.dlut.edu.cn/bbstcon.php?board=Competition&gid=23474 其实原文说得是比较清楚的,只是英文的,我这里写一份中文的吧. ...
- Manacher算法——求最长回文子串
首先,得先了解什么是回文串.回文串就是正反读起来就是一样的,如“abcdcba”.我们要是直接采用暴力方法来查找最长回文子串,时间复杂度为O(n^3),好一点的方法是枚举每一个字符,比较较它左右距离相 ...
- manacher算法求最长回文子串
一:背景 给定一个字符串,求出其最长回文子串.例如: s="abcd",最长回文长度为 1: s="ababa",最长回文长度为 5: s="abcc ...
- Manacher 求最长回文子串算法
Manacher算法,是由一个叫Manacher的人在1975年发明的,可以在$O(n)$的时间复杂度里求出一个字符串中的最长回文子串. 例如这两个回文串“level”.“noon”,Manacher ...
随机推荐
- bootstrap搜索样式
<div class="container"> <div class="input-group"> <input type=&qu ...
- oracle ash性能报告的使用方法
活动会话历史报告活动会话历史v$active_session_history视图提供了在实例级别抽取会话活动信息.活动会话每分钟会被抽样一次且被存储在sga中的循环缓冲区中.任何被连接到数据库且正等待 ...
- 2014/09/20 关于ArrayList的几种操作
1.删除ArrayList集合元素 删除ArrayList集合里面的元素时,提供了Clear方法,Remove方法,RmoveAt方法和RemoveRange方法. Clear方法是移除所有的元素 R ...
- 你要的 React 面试知识点,都在这了
摘要: 问题很详细,插图很好看. 原文:你要的 React 面试知识点,都在这了 作者:前端小智 Fundebug经授权转载,版权归原作者所有. React是流行的javascript框架之一,在20 ...
- HUdson2092整数解
2019-05-17 16:04:37 加油,坚持就是胜利,fightting m / i的情况,i可能等于0 #include <bits/stdc++.h> using namespa ...
- ES6 Proxy 性能之我见
ES6 Proxy 性能之我见 本文翻译自https://thecodebarbarian.com/thoughts-on-es6-proxies-performance Proxy是ES6的一个强力 ...
- Npgsql使用入门(二)【实用助手类】
数据库映射的实体类: public class Test { public long TestID { get; set; } public string Name { get; set; } pub ...
- 更换WordPress编辑器为TinyMCE Advanced
WordPress自带的编辑器功能很少,连更换字体样式大小都不行,没关系WordPress的插件中心插件非常多 在插件中心搜索TinyMCE Advanced 安装启用 还没完 点击设置 里面有丰富的 ...
- (转)webpack从零开始第6课:在Vue开发中使用webpack
vue官方已经写好一个vue-webpack模板vue_cli,原本自己写一个,发现官方写得已经够好了,自己写显得有点多余,但为了让大家熟悉webpack,决定还是一步一步从0开始写,但源文件就直接拷 ...
- Android线性渐变
布局实现: 1. 在res中建立drawable文件夹. 2. 在drawable文件夹中建立shape.xml. 3. shape.xml的代码如下: <?xml version=" ...