扩展KMP--求字符串S的所有后缀和字符串T的最长公共前缀
在解上面这个问题前我们要先解决一个类似的问题:求字符串s的所有后缀和s本身的最长公共前缀;
我们用next[]数组保存这些值;
现在我们假设要求next[ x ],并且next[ i ] 0<i<x的值都已经求出;
我们设p = k + next[k] - 1, k是使p最大的 i (0<i<x);如图:
现在整理一下问题:
已知:s[k..p] == s[ 0 .. next[ k ]-1 ],求s[x .. n-1]与s[0 .. n-1]的最长公共前缀;
由s[k .. p] == s[ 0 .. next[ k ]-1 ] 得:
s[x .. p] == s[x-k .. next[ k ]-1 ] ---------1//这个是显然的
并设L1=p-x+1;
因为x-k肯定是小于x的所以 L2=next[x-k]是已知的,得:
s[0 .. L2-1] == s[x-k .. x-k+L2-1]; --------2
通过等式1,2可以推出 s[0 .. k1] == s[x .. k2]
if L1<=L2 then 如下图
表示s[0 .. L1-1] == s[x .. x+L1-1]但不能确定蓝色部分是否相等,所以需要继续比下去
if L1 > L2 then 如下图:
表示s[0 .. L2-1] == s[x .. x+L2-1] 而且因为L2 = next[x-k]使得s[L2] != s[x+L2]
所以next[x] = L2;
证明:假设s[L2]==s[x+L2],又因为s[x+L2]==s[x-k+L2]//由1推出
所以s[L2]==s[x-k+L2] 所以next[x-k]==L2+1与next[x-k]==L2矛盾
void getNext(char *s,int next[]){
int nn = strlen(s);
next[] = nn;
int p = ;
while (p+ < nn && s[p] == s[p+]) p++;
next[] = p;
int k = , L;
for (int i = ; i < nn; i++){
p = k + next[k] - ; L = next[i - k];
if (i + L <= p) next[i] = L;
else {
int j = p - i + ;
if (j < ) j = ;
while (i + j < nn && s[i + j] == s[j]) j++;
next[i] = j; k = i; }
}
/* for (int i=0;i<nn;i++){
cout<< next[i] <<" ";
}cout<<endl;
*/
}
回到原来的问题
此时已经求出next[],我们用extend[]保存字符串S的所有后缀和字符串T的最长公共前缀的值
我们重复上面的过程:
现在我们假设要求extend[ x ],并且extend[ i ] 0<i<x的值都已经求出;
我们设p = k + extend[k] - 1, k是使p最大的 i (0<i<x);如图:
现在整理一下问题:
已知:s[k..p] == T[ 0 .. extend[ k ]-1 ],求s[x .. n-1]与T[0 .. m-1]的最长公共前缀;
由s[k .. p] == T[ 0 .. extend[ k ]-1 ] 得:
s[x .. p] == T[x-k .. extend[ k ]-1 ] ---------1//这个是显然的
并设L1=p-x+1;
因为x-k肯定是小于x的所以 L2=next[x-k]是已知的,得:
T[0 .. L2-1] == T[x-k .. x-k+L2-1]; --------2
通过等式1,2可以推出 T[0 .. k1] == s[x .. k2]
if L1<=L2 then 如下图
表示T[0 .. L1-1] == s[x .. x+L1-1]但不能确定蓝色部分是否相等,所以需要继续比下去
if L1 > L2 then 如下图:
表示T[0 .. L2-1] == s[x .. x+L2-1] 而且因为L2 = extend[x-k]使得T[L2] != s[x+L2]
所以extend[x] = L2;
证明:假设T[L2]==s[x+L2],又因为s[x+L2]==T[x-k+L2]//由1推出
所以T[L2]==s[x-k+L2] 所以extend[x-k]==L2+1与extend[x-k]==L2矛盾
void getExtend(char *s,char *T,int extend[]){
int nn = strlen(s) ,mm = strlen(T);
getNext(s,next);
int p = ;
while (p < nn && s[p] == T[p]) p++;
extend[] = p;
//extend[1] = p;
int k = , L;
for (int i = ; i < nn; i++){
p = k + extend[k] - ; L = next[i - k];
if (i + L <= p) extend[i] = L;
else {
int j = p - i + ;
if (j < ) j = ;
while (i + j < nn && s[i + j] == T[j]) j++;
extend[i] = j; k = i; }
}
/* for (int i=0;i<nn;i++){
cout<< extend[i] <<" ";
}cout<<endl;
*/
}
时间复杂度分析:
对于s串,每一位最多比较一次所以时间是O(n)的;
扩展KMP--求字符串S的所有后缀和字符串T的最长公共前缀的更多相关文章
- hdu6153 扩展kmp求一个字符串的后缀在另一个字符串出现的次数。
/** 题目:hdu6153 链接:http://acm.hdu.edu.cn/showproblem.php?pid=6153 题意:给定两个串,求其中一个串t的每个后缀在另一个串s中出现的次数乘以 ...
- hdoj 2594 Simpsons’ Hidden Talents 【KMP】【求串的最长公共前缀后缀】
Simpsons' Hidden Talents Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java ...
- [转][LeetCode]Longest Common Prefix ——求字符串的最长公共前缀
题记: 这道题不难但是很有意思,有两种解题思路,可以说一种是横向扫描,一种是纵向扫描. 横向扫描:遍历所有字符串,每次跟当前得出的最长公共前缀串进行对比,不断修正,最后得出最长公共前缀串. 纵向扫描: ...
- LeetCode -- 求字符串数组中的最长公共前缀
题目描写叙述: Write a function to find the longest common prefix string amongst an array of strings.就是给定1个 ...
- BNUOJ34990--Justice String (exkmp求最长公共前缀)
Justice String Given two strings A and B, your task is to find a substring of A called justice strin ...
- CSU1632Repeated Substrings(后缀数组/最长公共前缀)
题意就是求一个字符串的重复出现(出现次数>=2)的不同子串的个数. 标准解法是后缀数组.最长公共前缀的应用,对于样例aabaab,先将所有后缀排序: aab 3 aabaab 1 a ...
- python 字符串最长公共前缀
编写一个函数来查找字符串数组中的最长公共前缀. 如果不存在公共前缀,返回空字符串 "". 示例 1: 输入: ["flower","flow&qu ...
- leetcode.字符串.14最长公共前缀-Java
1. 具体题目 编写一个函数来查找字符串数组中的最长公共前缀.如果不存在公共前缀,返回空字符串 "". 示例 1: 输入: ["flower","fl ...
- HDU 3613 Best Reward(扩展KMP求前后缀回文串)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3613 题目大意: 大意就是将字符串s分成两部分子串,若子串是回文串则需计算价值,否则价值为0,求分割 ...
随机推荐
- [Codeforces137C]History(排序,水题)
题目链接:http://codeforces.com/contest/137/problem/C 题意:给n对数,分别是一个事件的起始和终止时间.问被有几个事件被其他事件包含. 思路:先排序,按照起始 ...
- Sublime Text汉化方法和注册码
汉化方法 安装 SublimeText3 汉化包运行SublimeText3 点击 Preferneces -> Browse Packages 会打开 X:\..\Sublime Text 3 ...
- zoj 3778 Talented Chef(思维题)
题目 题意:一个人可以在一分钟同时进行m道菜的一个步骤,共有n道菜,每道菜各有xi个步骤,求做完的最短时间. 思路:一道很水的思维题, 根本不需要去 考虑模拟过程 以及先做那道菜(比赛的时候就是这么考 ...
- bzoj2797
对和排序,显然最小是a1+a2,次小a1+a3 然后穷举哪里是a2+a3 这样a1,a2,a3就求出来了 注意a2+a3只可能是前n+1项中的一个,所以穷举这步是O(n)的 接下来我们把已经确定的数的 ...
- PNG文件结构分析 ---Png解析
PNG文件结构分析 ---Png解析 为了实现更高级的应用,我们必须充分挖掘PNG的潜力. PNG的文件结构 根据PNG文件的定义来说,其文件头位置总是由位固定的字节来描述的: 十进制数 13 ...
- liux下ftp链接服务器的常用命令
FTP命令是Internet用户使用最频繁的命令之一,不论是在DOS还是UNIX操作系统下使用 FTP,都会遇到大量的FTP内部命令.熟悉并灵活应用FTP的内部命令,可以大大方便使用者,并收到事半功倍 ...
- 【转】定时器、sigevent结构体详解
原文网址:http://blog.163.com/zheng_he_xiang/blog/static/18650532620116311020390/ 最强大的定时器接口来自POSIX时钟系列,其创 ...
- MySQL基础之第1章 数据库概述
1.1.数据存储方式 1.人工管理阶段2.文件系统阶段3.数据库系统阶段 1.2.数据库泛型 数据库泛型就是数据库应该遵循的规则.数据库泛型也称为范式.目前关系数据库最常用的四种范式分别是:第一范式( ...
- POJ 1716 Integer Intervals
题意:给出一些区间,求一个集合的长度要求每个区间里都至少有两个集合里的数. 解法:贪心或者差分约束.贪心的思路很简单,只要将区间按右边界排序,如果集合里最后两个元素都不在当前区间内,就把这个区间内的最 ...
- 解决32位plsql客户端连接不64位Oracle11g上数据库
一.解决方案 因为本人安装的是64位的Oracle,plsql 是32位的故连接不上.网上有方法能连接. 1. 文件下载 下载PLSQL_Developer地址 http://pan.baidu.co ...