KMP算法中next数组的理解与算法的实现（java语言）

KMP 算法我们有写好的函数帮我们计算 Next 数组的值和 Nextval 数组的值，但是如果是考试，那就只能自己来手算这两个数组了，这里分享一下我的计算方法吧。

计算前缀 Next[i] 的值:

我们令 next[0] = -1 。从 next[1] 开始，每求一个字符的 next 值，就看它前面是否有一个最长的"字符串"和从第一个字符开始的"字符串"相等(需要注意的是，这2个"字符串"不能是同一个"字符串")。如果一个都没有，这个字符的 next 值就是0；如果有，就看它有多长，这个字符的 next 值就是它的长度。

计算修正后的 Nextval[i] 值:

我们令 nextval[0] = -1。从 nextval[1] 开始，如果某位(字符)与它 next 值指向的位(字符)相同，则该位的 nextval 值就是指向位的 nextval 值(nextval[i] = nextval[ next[i] ])；如果不同，则该位的 nextval 值就是它自己的 next 值(nextvalue[i] = next[i])。

举个例子:

计算前缀 Next[i] 的值:

next[0] = -1;定值。
next[1] = 0;s[1]前面没有重复子串。
next[2] = 0;s[2]前面没有重复子串。
next[3] = 0;s[3]前面没有重复子串。
next[4] = 1;s[4]前面有重复子串s[0] = 'a'和s[3] = 'a'。
next[5] = 2;s[5]前面有重复子串s[01] = 'ab'和s[34] = 'ab'。
next[6] = 3;s[6]前面有重复子串s[012] = 'abc'和s[345] = 'abc'。
next[7] = 4;s[7]前面有重复子串s[0123] = 'abca'和s[3456] = 'abca'。

计算修正后的 Nextval[i] 值:

nextval[0] = -1;定值。
nextval[1] = 0;s[1] != s[0]，nextval[1] = next[1] = 0。
nextval[2] = 0;s[2] != s[0]，nextval[2] = next[2] = 0。
nextval[3] = -1;s[3] == s[0]，nextval[3] = nextval[0] = -1。
nextval[4] = 0;s[4] == s[1]，nextval[4] = nextval[1] = 0。
nextval[5] = 0;s[5] == s[2]，nextval[5] = nextval[2] = 0。
nextval[6] = -1;s[6] == s[3]，nextval[6] = nextval[3] = -1。
nextval[7] = 4;s[7] != s[4]，nextval[7] = next[7] = 4。

next[] 数组的定义为(相对C++):最后程序算法是用JAVA
next[1]= 0;
next ( i>=0 ) 为：对于模式串 S[], 我们用 S[i, j] 表示从 S[] 中 i 到 j 这一段子串。找一个 k(0< k< i ) 使得，S[0, k-1] 与 S[i- k, i-1] 完全匹配，并且 k 的值最大，那么 next= k; 如果不存在完全匹配的，next= 0;
1 2 3 4 5 6 7 8
如对于串 a b a a b c a c , next[1]= 0, 显然 next[2]= 1;
i== 3 时，满足 0< k< 2 的 k 只有 1, 而 S[0, 0] 与 S[1,1] 不完全匹配，所以 next[3]= 1;
i== 4 时，满足 0< k< 3 的 k 有 1, 2, S[0,1] 'ab' 与 S[1,2] 'ba' 不完全匹配，S[0,0] 'a' 与 S[2,2] ’a' 完全匹配，故 next[4]= 2;
i== 5 时， S[0,2] ’aba' != S[1,3] 'baa' S[0,1] 'ab'!= S[2,3] 'aa' S[0,0]== S[3,3]，故 next[5]= 2;
同理： next[6]= 3, next[7]= 1, next[8]= 2;

可以用递推的方法求得 next[] 数组
假设 next = k, 则有 S[0, k-1]== S[i-k, i-1], 如何求 next[i+1]?
1). 如果 S[k]== S[i+1], 则有 S[0,k]== S[i-k, i], 可以肯定，不可能存在 x> k, 使得 S[0, x]== S[i-x, i] 故 next[i+1]= next+ 1= k+ 1;
2). 如果 S[k]!= S[i+1], 可看成是一个模式匹配问题，相当于 S[len(S)-K, len(S)]为主串， S[0, len(S)] 为模式串的模式匹配，这时应将模式串向右滑动 next[k] 个字符，再比较 S[ next[k] ]与 S[i+1]，如果相等，则 next[i+1]= next[ next[k] ]+ 1, 如此继续。

  1 public class KMP

  2 {

  3     // KMP中的核心算法，获得记录跳转状态的next数组

  4     public static int[] next(String sub)

  5     {

  6         int[] next = new int[sub.length() + 1];

  7         char[] T = sub.toCharArray();

  8         int length = sub.length();

  9

 10         int i, j;

 11         i = 1;

 12         j = 0;

 13         next[1] = 0;//第一个字符的next值是0, 假设数组next是从1开始的算，next[0]不用

 14         while (i < length)

 15         {

 16             if (j == 0 || T[i - 1] == T[j - 1])// 此处T[i]表示后缀单个字符，T[j]表前缀

 17             {

 18                 ++i;

 19                 ++j;

 20                 next[i] = j;//存放当前的next值为此时模式串的游标值

 21             } else

 22                 j = next[j];// 若字符不同，刚j值回溯

 23             //System.out.println("i:" + i + "  j:" + j);

 24         }

 25         return next;

 26     }

 27

 28     public static int[] nextval(String sub)

 29     {

 30         int[] next = new int[sub.length() + 1];

 31         char[] T = sub.toCharArray();

 32         int length = sub.length();

 33

 34         int i, j;

 35         i = 1;

 36         j = 0;

 37         next[1] = 0;

 38         while (i < length)

 39         {

 40             if (j == 0 || T[i - 1] == T[j - 1])// 此处T[i]表示后缀单个字符，T[j]表前缀

 41             {

 42                 ++i;

 43                 ++j;

 44

 45                 if (T[i - 1] != T[j - 1]) // 若当前字符与前缀字符不同

 46                 {

 47                     next[i] = j;

 48                 } else

 49                 {

 50                     next[i] = next[j]; // 若相同，刚将前缀字符的next值赋给next在i位置的值

 51                 }

 52

 53             } else

 54                 j = next[j];// 若字符不同，刚j值回溯

 55             //System.out.println("i:" + i + "  j:" + j);

 56         }

 57         return next;

 58     }

 59

 60     public static int Index_KMP(String str, String sub, int pos)

 61     {

 62         char[] S = str.toCharArray();

 63         char[] T = sub.toCharArray();

 64         int[] next = next(sub);

 65         int i;

 66         if (pos < 1)

 67         {

 68             System.out.println("起位置输入错误，默认设置为1");

 69             i = 1;

 70         } else

 71         {

 72             i = pos;

 73         }

 74         int j = 1; // i控制S,j控制T;

 75         while (i <= S.length && j <= T.length)

 76         {

 77             if (j == 0 || S[i - 1] == T[j - 1])

 78             {

 79                 ++i;

 80                 ++j;

 81             } else

 82             {

 83                 j = next[j]; // j退回合适的位置，i值不变

 84             }

 85         }

 86         if (j > T.length)

 87             return i - T.length;

 88         else

 89             return 0;

 90     }

 91

 92     public static void main(String[] args)

 93     {

 94         String sub = "abaabcac";

 95         String str = "zzzaabaabcacfdsafas";

 96         int[] next = next(sub);

 97         System.out.print("next数组是：");

 98         for (int i = 1; i < next.length; i++)

 99         {

100             System.out.print(next[i]);

101         }

102

103          int index = Index_KMP(str, sub, 1);

104          System.out.print("\n匹配位置为：" + index);

105     }

106 }

KMP算法中next数组的理解与算法的实现（java语言）的更多相关文章

poj 2406:Power Strings（KMP算法，next[]数组的理解）
Power Strings Time Limit: 3000MS Memory Limit: 65536K Total Submissions: 30069 Accepted: 12553 D ...
KMP算法的实现(Java语言描述)
标签:it KMP算法是模式匹配专用算法. 它是在已知模式串的next或nextval数组的基础上执行的.如果不知道它们二者之一,就没法使用KMP算法,因此我们需要计算它们. KMP算法由两部分组成: ...
KMP算法中next函数的理解
首先要感谢http://blog.csdn.net/v_july_v/article/details/7041827以及http://blog.chinaunix.net/uid-27164517-i ...
KMP算法中next数组的构建
记得初学$kmp$的时候老师让大家把它直接背下来然而不理解的话不仅调试起来比较慢很多题目也难往$kmp$上想 ----------------------------------------- ...
字符串匹配KMP算法中Next[]数组和Nextval[]数组求法
数据结构课本上给了这么一段算法求nextval9[]数组 int get_nextval(SString T,int &nextval[ ]) { //求模式串T的next函数修正值并存入数组 ...
hdu 1358:Period（KMP算法，next[]数组的使用）
Period Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Subm ...
KMP算法中我对获取next数组的理解
之前在学KMP算法时一直理解不了获取next数组的函数是如何实现的,现在大概知道怎么一回事了,记录一下我对获取next数组的理解. KMP算法实现的原理就不再赘述了,先上KMP代码: 1 void g ...
问题 1690: 算法4-7：KMP算法中的模式串移动数组
题目链接:https://www.dotcpp.com/oj/problem1690.html 题目描述字符串的子串定位称为模式匹配,模式匹配可以有多种方法.简单的算法可以使用两重嵌套循环,时间复杂 ...
KMP 算法中的 next 数组
KMP 算法中对 next 数组的理解 next 数组的意义此处 next[j] = k:则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同: next[j] 表示当位置 j 的字符串与主串不匹 ...

随机推荐

codeforces 879c
C. Short Program time limit per test 2 seconds memory limit per test 256 megabytes input standard in ...
js-数组方法push
<script type="text/javascript"> var arr=[1,2,3,4,5] arr.push(6,7) ...
uva 10918 - Tri Tiling（规律）
题目链接:uva 10918 - Tri Tiling 题目大意:给出n,计算用1*2的瓷砖有多少种方法铺满3*n的地方. 解题思路:和uva 10359 - Tiling有点相似,不过难度会比较大, ...
获取物料分类excel公式
物料格式大类|中类|小类|名称|....... =MID(D2,FIND("|",D2,FIND("|",D2)+1)+1,FIND("|&qu ...
cxgrid动态多表头
function TForm15.CreateBand(View: TcxGridDBBandedTableView; BandCaption, ParentBandCaption: String) ...
Spring Webservices（转）
17.5. Web Services Spring为标准Java web服务API提供了全面的支持: 使用JAX-RPC暴露web服务使用JAX-RPC访问web服务使用JAX-WS暴露web服务 ...
tfs查看最近签入记录及文件
在团队资源管理=>源代码管理资源管理器=>选择某个最近签入的文件夹=>右键=>查看历史记录=>双击某个文件夹就能看到最近变更集文件
asp.net web api 跨域问题
缘起以前在asp.net mvc时代,很少出现跨域问题自从使用了asp.net web api + angular (1/2)之后,开始有跨域问题了. 简单普及下跨域: 我的理解是只要是前台页面与 ...
C# winfrom 写的一个搜索助手，可以按照标题和内容搜索，支持doc,xls,ppt,pdf,txt等格式的文件搜索
C# winfrom 写的一个搜索助手,可以按照标题和内容搜索,指定目录后,遍历搜索文件和子目,现在只写了支持.DOC.DOCX.XLS.XLSX.PPT.PPTX.PDF.HTML.HTM.TXT等 ...
pageadmin CMS自助建站系统教程：模板中执行sql语句
PageAdmin系统提供了一个内置的数据库访问对象,声明如下: DataBaseContext dbContext = DbHelper.DbContext(); 通过DataBaseContext ...

KMP算法中next数组的理解与算法的实现（java语言）

KMP算法中next数组的理解与算法的实现（java语言）的更多相关文章

随机推荐

热门专题