在解上面这个问题前我们要先解决一个类似的问题:求字符串s的所有后缀和s本身的最长公共前缀;

我们用next[]数组保存这些值;

现在我们假设要求next[ x ],并且next[ i ] 0<i<x的值都已经求出;

我们设p = k + next[k] - 1, k是使p最大的 i  (0<i<x);如图:

现在整理一下问题:

  已知:s[k..p] == s[ 0 .. next[ k ]-1 ],求s[x .. n-1]与s[0 .. n-1]的最长公共前缀;

  由s[k .. p] == s[ 0 .. next[ k ]-1 ] 得:

s[x .. p] == s[x-k .. next[ k ]-1 ]    ---------1//这个是显然的

并设L1=p-x+1;

因为x-k肯定是小于x的所以  L2=next[x-k]是已知的,得:

s[0 ..  L2-1] == s[x-k .. x-k+L2-1];      --------2

通过等式1,2可以推出 s[0 .. k1] == s[x .. k2]

if  L1<=L2  then  如下图

表示s[0 .. L1-1] == s[x .. x+L1-1]但不能确定蓝色部分是否相等,所以需要继续比下去

if  L1 > L2   then 如下图:

表示s[0 ..  L2-1] == s[x .. x+L2-1] 而且因为L2 = next[x-k]使得s[L2] != s[x+L2]

所以next[x] = L2;

证明:假设s[L2]==s[x+L2],又因为s[x+L2]==s[x-k+L2]//由1推出

所以s[L2]==s[x-k+L2] 所以next[x-k]==L2+1与next[x-k]==L2矛盾

 void getNext(char *s,int next[]){
int nn = strlen(s);
next[] = nn;
int p = ;
while (p+ < nn && s[p] == s[p+]) p++;
next[] = p;
int k = , L;
for (int i = ; i < nn; i++){
p = k + next[k] - ; L = next[i - k];
if (i + L <= p) next[i] = L;
else {
int j = p - i + ;
if (j < ) j = ;
while (i + j < nn && s[i + j] == s[j]) j++;
next[i] = j; k = i; }
}
/* for (int i=0;i<nn;i++){
cout<< next[i] <<" ";
}cout<<endl;
*/
}

回到原来的问题

此时已经求出next[],我们用extend[]保存字符串S的所有后缀和字符串T的最长公共前缀的值

我们重复上面的过程:

现在我们假设要求extend[ x ],并且extend[ i ] 0<i<x的值都已经求出;

我们设p = k + extend[k] - 1, k是使p最大的 i  (0<i<x);如图:

现在整理一下问题:

  已知:s[k..p] == T[ 0 .. extend[ k ]-1 ],求s[x .. n-1]与T[0 .. m-1]的最长公共前缀;

  由s[k .. p] == T[ 0 .. extend[ k ]-1 ] 得:

s[x .. p] == T[x-k .. extend[ k ]-1 ]    ---------1//这个是显然的

并设L1=p-x+1;

因为x-k肯定是小于x的所以  L2=next[x-k]是已知的,得:

T[0 ..  L2-1] == T[x-k .. x-k+L2-1];      --------2

通过等式1,2可以推出 T[0 .. k1] == s[x .. k2]

if  L1<=L2  then  如下图

表示T[0 .. L1-1] == s[x .. x+L1-1]但不能确定蓝色部分是否相等,所以需要继续比下去

if  L1 > L2   then 如下图:

表示T[0 ..  L2-1] == s[x .. x+L2-1] 而且因为L2 = extend[x-k]使得T[L2] != s[x+L2]

所以extend[x] = L2;

证明:假设T[L2]==s[x+L2],又因为s[x+L2]==T[x-k+L2]//由1推出

所以T[L2]==s[x-k+L2] 所以extend[x-k]==L2+1与extend[x-k]==L2矛盾

 void getExtend(char *s,char *T,int extend[]){
int nn = strlen(s) ,mm = strlen(T);
getNext(s,next);
int p = ;
while (p < nn && s[p] == T[p]) p++;
extend[] = p;
//extend[1] = p;
int k = , L;
for (int i = ; i < nn; i++){
p = k + extend[k] - ; L = next[i - k];
if (i + L <= p) extend[i] = L;
else {
int j = p - i + ;
if (j < ) j = ;
while (i + j < nn && s[i + j] == T[j]) j++;
extend[i] = j; k = i; }
}
/* for (int i=0;i<nn;i++){
cout<< extend[i] <<" ";
}cout<<endl;
*/
}

时间复杂度分析:

对于s串,每一位最多比较一次所以时间是O(n)的;

扩展KMP--求字符串S的所有后缀和字符串T的最长公共前缀的更多相关文章

  1. hdu6153 扩展kmp求一个字符串的后缀在另一个字符串出现的次数。

    /** 题目:hdu6153 链接:http://acm.hdu.edu.cn/showproblem.php?pid=6153 题意:给定两个串,求其中一个串t的每个后缀在另一个串s中出现的次数乘以 ...

  2. hdoj 2594 Simpsons’ Hidden Talents 【KMP】【求串的最长公共前缀后缀】

    Simpsons' Hidden Talents Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java ...

  3. [转][LeetCode]Longest Common Prefix ——求字符串的最长公共前缀

    题记: 这道题不难但是很有意思,有两种解题思路,可以说一种是横向扫描,一种是纵向扫描. 横向扫描:遍历所有字符串,每次跟当前得出的最长公共前缀串进行对比,不断修正,最后得出最长公共前缀串. 纵向扫描: ...

  4. LeetCode -- 求字符串数组中的最长公共前缀

    题目描写叙述: Write a function to find the longest common prefix string amongst an array of strings.就是给定1个 ...

  5. BNUOJ34990--Justice String (exkmp求最长公共前缀)

    Justice String Given two strings A and B, your task is to find a substring of A called justice strin ...

  6. CSU1632Repeated Substrings(后缀数组/最长公共前缀)

    题意就是求一个字符串的重复出现(出现次数>=2)的不同子串的个数. 标准解法是后缀数组.最长公共前缀的应用,对于样例aabaab,先将所有后缀排序: aab 3    aabaab 1    a ...

  7. python 字符串最长公共前缀

      编写一个函数来查找字符串数组中的最长公共前缀. 如果不存在公共前缀,返回空字符串 "". 示例 1: 输入: ["flower","flow&qu ...

  8. leetcode.字符串.14最长公共前缀-Java

    1. 具体题目 编写一个函数来查找字符串数组中的最长公共前缀.如果不存在公共前缀,返回空字符串 "". 示例 1: 输入: ["flower","fl ...

  9. HDU 3613 Best Reward(扩展KMP求前后缀回文串)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3613 题目大意: 大意就是将字符串s分成两部分子串,若子串是回文串则需计算价值,否则价值为0,求分割 ...

随机推荐

  1. 转:java提取图片中的像素

    本文转自:http://www.infosys.tuwien.ac.at/teaching/courses/WebEngineering/References/java/docs/api/java/a ...

  2. 1124. Mosaic(dfs)

    1124 需要想那么一点点吧 一个连通块中肯定不需要伸进手不拿的情况 不是一个肯定会需要这种情况 然后注意一点 sum=0的时候 就输出0就可以了 不要再减一了 #include <iostre ...

  3. csv 文件介绍

    CSV即Comma Separate Values,这种文件格式经常用来作为不同程序之间的数据交互的格式. 具体文件格式 每条记录占一行 以逗号为分隔符 逗号前后的空格会被忽略 字段中包含有逗号,该字 ...

  4. UVa 11361 (计数 递推) Investigating Div-Sum Property

    题意: 统计[a, b]中有多少个数字满足:自身是k的倍数,而且各个数字之和也是k的倍数. 分析: 详细分析见<训练之南>吧,=_=|| 书上提出了一个模板的概念,有了模板我们就可以分块计 ...

  5. Zxing 扫二维码

    1 http://blog.csdn.net/xiaanming/article/details/10163203 2 我会把一个可以运行的Demo云盘:http://pan.baidu.com/s/ ...

  6. win7x64下的redis安装与使用

    先引用百度百科的一段话吧,具体可以到百科查看吧. Redis是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API.从2010年 ...

  7. ubuntu12.04下txt文件乱码如何解决

    :gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8','GB18030','GB2312' ...

  8. datatables 服务器返回数据后的处理-表格数据属性的操作方法(ajax.dataSrc)

    http://dt.thxopen.com/reference/option/ajax.dataSrc.html http://datatables.net/reference/option/ajax ...

  9. Java [leetcode 3] Longest Substring Without Repeating Characters

    问题描述: Given a string, find the length of the longest substring without repeating characters. For exa ...

  10. 【C#学习笔记】载入图片并居中

    using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...