KMP 算法我们有写好的函数帮我们计算 Next 数组的值和 Nextval 数组的值,但是如果是考试,那就只能自己来手算这两个数组了,这里分享一下我的计算方法吧。

计算前缀 Next[i] 的值:

我们令 next[0] = -1 。从 next[1] 开始,每求一个字符的 next 值,就看它前面是否有一个最长的"字符串"和从第一个字符开始的"字符串"相等(需要注意的是,这2个"字符串"不能是同一个"字符串")。如果一个都没有,这个字符的 next 值就是0;如果有,就看它有多长,这个字符的 next 值就是它的长度。

计算修正后的 Nextval[i] 值:

我们令 nextval[0] = -1。从 nextval[1] 开始,如果某位(字符)与它 next 值指向的位(字符)相同,则该位的 nextval 值就是指向位的 nextval 值(nextval[i] = nextval[ next[i] ]);如果不同,则该位的 nextval 值就是它自己的 next 值(nextvalue[i] = next[i])。

举个例子:

计算前缀 Next[i] 的值:

next[0] = -1;定值。
next[1] = 0;s[1]前面没有重复子串。
next[2] = 0;s[2]前面没有重复子串。
next[3] = 0;s[3]前面没有重复子串。
next[4] = 1;s[4]前面有重复子串s[0] = 'a'和s[3] = 'a'。
next[5] = 2;s[5]前面有重复子串s[01] = 'ab'和s[34] = 'ab'。
next[6] = 3;s[6]前面有重复子串s[012] = 'abc'和s[345] = 'abc'。
next[7] = 4;s[7]前面有重复子串s[0123] = 'abca'和s[3456] = 'abca'。

计算修正后的 Nextval[i] 值:

nextval[0] = -1;定值。
nextval[1] = 0;s[1] != s[0],nextval[1] = next[1] = 0。
nextval[2] = 0;s[2] != s[0],nextval[2] = next[2] = 0。
nextval[3] = -1;s[3] == s[0],nextval[3] = nextval[0] = -1。
nextval[4] = 0;s[4] == s[1],nextval[4] = nextval[1] = 0。
nextval[5] = 0;s[5] == s[2],nextval[5] = nextval[2] = 0。
nextval[6] = -1;s[6] == s[3],nextval[6] = nextval[3] = -1。
nextval[7] = 4;s[7] != s[4],nextval[7] = next[7] = 4。

next[] 数组的定义为(相对C++):最后程序算法是用JAVA
next[1]= 0;
next ( i>=0 ) 为:  对于模式串 S[],  我们用 S[i, j] 表示从 S[] 中 i 到 j 这一段子串。 找一个 k(0< k< i ) 使得,S[0, k-1] 与 S[i- k, i-1] 完全匹配,并且 k 的值最大, 那么 next= k; 如果不存在完全匹配的,next= 0;
               1 2 3 4 5 6 7 8
如对于串    a b a a b c a c ,  next[1]= 0, 显然 next[2]= 1;
i== 3 时, 满足 0< k< 2 的 k 只有 1, 而 S[0, 0] 与 S[1,1] 不完全匹配,所以 next[3]= 1;
i== 4 时, 满足 0< k< 3 的 k 有 1, 2,  S[0,1] 'ab' 与 S[1,2] 'ba' 不完全匹配,S[0,0] 'a' 与 S[2,2] ’a' 完全匹配, 故 next[4]= 2;
i== 5 时,  S[0,2] ’aba' != S[1,3] 'baa'      S[0,1] 'ab'!= S[2,3] 'aa'  S[0,0]== S[3,3],故 next[5]= 2;
同理: next[6]= 3, next[7]= 1, next[8]= 2;

可以用递推的方法求得 next[] 数组
假设 next = k, 则有 S[0, k-1]== S[i-k, i-1], 如何求 next[i+1]?
1). 如果 S[k]== S[i+1], 则有 S[0,k]== S[i-k, i],  可以肯定,不可能存在 x> k, 使得 S[0, x]== S[i-x, i] 故 next[i+1]= next+ 1= k+ 1;
2). 如果 S[k]!= S[i+1], 可看成是一个模式匹配问题,相当于 S[len(S)-K, len(S)]为主串, S[0, len(S)]  为模式串的模式匹配,这时应将模式串向右滑动 next[k] 个字符, 再比较 S[ next[k] ]与 S[i+1], 如果相等, 则 next[i+1]= next[ next[k] ]+ 1, 如此继续。

  1. 1 public class KMP
  2. 2 {
  3. 3 // KMP中的核心算法,获得记录跳转状态的next数组
  4. 4 public static int[] next(String sub)
  5. 5 {
  6. 6 int[] next = new int[sub.length() + 1];
  7. 7 char[] T = sub.toCharArray();
  8. 8 int length = sub.length();
  9. 9
  10. 10 int i, j;
  11. 11 i = 1;
  12. 12 j = 0;
  13. 13 next[1] = 0;//第一个字符的next值是0, 假设数组next是从1开始的算,next[0]不用
  14. 14 while (i < length)
  15. 15 {
  16. 16 if (j == 0 || T[i - 1] == T[j - 1])// 此处T[i]表示后缀单个字符,T[j]表前缀
  17. 17 {
  18. 18 ++i;
  19. 19 ++j;
  20. 20 next[i] = j;//存放当前的next值为此时模式串的游标值
  21. 21 } else
  22. 22 j = next[j];// 若字符不同,刚j值回溯
  23. 23 //System.out.println("i:" + i + " j:" + j);
  24. 24 }
  25. 25 return next;
  26. 26 }
  27. 27
  28. 28 public static int[] nextval(String sub)
  29. 29 {
  30. 30 int[] next = new int[sub.length() + 1];
  31. 31 char[] T = sub.toCharArray();
  32. 32 int length = sub.length();
  33. 33
  34. 34 int i, j;
  35. 35 i = 1;
  36. 36 j = 0;
  37. 37 next[1] = 0;
  38. 38 while (i < length)
  39. 39 {
  40. 40 if (j == 0 || T[i - 1] == T[j - 1])// 此处T[i]表示后缀单个字符,T[j]表前缀
  41. 41 {
  42. 42 ++i;
  43. 43 ++j;
  44. 44
  45. 45 if (T[i - 1] != T[j - 1]) // 若当前字符与前缀字符不同
  46. 46 {
  47. 47 next[i] = j;
  48. 48 } else
  49. 49 {
  50. 50 next[i] = next[j]; // 若相同,刚将前缀字符的next值赋给next在i位置的值
  51. 51 }
  52. 52
  53. 53 } else
  54. 54 j = next[j];// 若字符不同,刚j值回溯
  55. 55 //System.out.println("i:" + i + " j:" + j);
  56. 56 }
  57. 57 return next;
  58. 58 }
  59. 59
  60. 60 public static int Index_KMP(String str, String sub, int pos)
  61. 61 {
  62. 62 char[] S = str.toCharArray();
  63. 63 char[] T = sub.toCharArray();
  64. 64 int[] next = next(sub);
  65. 65 int i;
  66. 66 if (pos < 1)
  67. 67 {
  68. 68 System.out.println("起位置输入错误,默认设置为1");
  69. 69 i = 1;
  70. 70 } else
  71. 71 {
  72. 72 i = pos;
  73. 73 }
  74. 74 int j = 1; // i控制S,j控制T;
  75. 75 while (i <= S.length && j <= T.length)
  76. 76 {
  77. 77 if (j == 0 || S[i - 1] == T[j - 1])
  78. 78 {
  79. 79 ++i;
  80. 80 ++j;
  81. 81 } else
  82. 82 {
  83. 83 j = next[j]; // j退回合适的位置,i值不变
  84. 84 }
  85. 85 }
  86. 86 if (j > T.length)
  87. 87 return i - T.length;
  88. 88 else
  89. 89 return 0;
  90. 90 }
  91. 91
  92. 92 public static void main(String[] args)
  93. 93 {
  94. 94 String sub = "abaabcac";
  95. 95 String str = "zzzaabaabcacfdsafas";
  96. 96 int[] next = next(sub);
  97. 97 System.out.print("next数组是:");
  98. 98 for (int i = 1; i < next.length; i++)
  99. 99 {
  100. 100 System.out.print(next[i]);
  101. 101 }
  102. 102
  103. 103 int index = Index_KMP(str, sub, 1);
  104. 104 System.out.print("\n匹配位置为:" + index);
  105. 105 }
  106. 106 }

KMP算法中next数组的理解与算法的实现(java语言)的更多相关文章

  1. poj 2406:Power Strings(KMP算法,next[]数组的理解)

    Power Strings Time Limit: 3000MS   Memory Limit: 65536K Total Submissions: 30069   Accepted: 12553 D ...

  2. KMP算法的实现(Java语言描述)

    标签:it KMP算法是模式匹配专用算法. 它是在已知模式串的next或nextval数组的基础上执行的.如果不知道它们二者之一,就没法使用KMP算法,因此我们需要计算它们. KMP算法由两部分组成: ...

  3. KMP算法中next函数的理解

    首先要感谢http://blog.csdn.net/v_july_v/article/details/7041827以及http://blog.chinaunix.net/uid-27164517-i ...

  4. KMP算法中next数组的构建

    记得初学$kmp$的时候 老师让大家把它直接背下来 然而不理解的话 不仅调试起来比较慢 很多题目也难往$kmp$上想 ----------------------------------------- ...

  5. 字符串匹配KMP算法中Next[]数组和Nextval[]数组求法

    数据结构课本上给了这么一段算法求nextval9[]数组 int get_nextval(SString T,int &nextval[ ]) { //求模式串T的next函数修正值并存入数组 ...

  6. hdu 1358:Period(KMP算法,next[]数组的使用)

    Period Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Subm ...

  7. KMP算法中我对获取next数组的理解

    之前在学KMP算法时一直理解不了获取next数组的函数是如何实现的,现在大概知道怎么一回事了,记录一下我对获取next数组的理解. KMP算法实现的原理就不再赘述了,先上KMP代码: 1 void g ...

  8. 问题 1690: 算法4-7:KMP算法中的模式串移动数组

    题目链接:https://www.dotcpp.com/oj/problem1690.html 题目描述 字符串的子串定位称为模式匹配,模式匹配可以有多种方法.简单的算法可以使用两重嵌套循环,时间复杂 ...

  9. KMP 算法中的 next 数组

    KMP 算法中对 next 数组的理解 next 数组的意义 此处 next[j] = k:则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同: next[j] 表示当位置 j 的字符串与主串不匹 ...

随机推荐

  1. 团队项目之UML图设计---WeEdit

    团队信息: 学号: 姓名: 本次博客链接: 041602209 黄毓明(临时队长)  https://www.cnblogs.com/mingsonic/p/9820702.html 06160023 ...

  2. hdu2710 Max Factor

    题目 //下面这个是最先用的方法,因为学姐先讲完这个,所以懒得写代码,就将就着这个用,结果搞了老半天,还是错了,心累.. #include<stdio.h> #include<str ...

  3. Scala_基本语法

    基本语法 声明值和变量 Scala有两种类型的变量: val:是不可变的(变量的引用不可变),在声明时就必须被初始化,而且初始化以后就不能再赋值: var:声明的时候需要进行初始化,初始化以还可以再对 ...

  4. spring boot mybatis sql打印到控制台

    如何设置spring boot集成 mybatis 然后sql语句打印到控制台,方便调试: 设置方法: 在application.properties文件中添加: logging.level.com. ...

  5. RxSwift学习笔记6:Subjects/PublishSubject/BehaviorSubject/ReplaySubject/Variable

    // 从前面的几篇文章可以发现,当我们创建一个 Observable 的时候就要预先将要发出的数据都准备好,等到有人订阅它时再将数据通过 Event 发出去. // 但有时我们希望 Observabl ...

  6. Http站点转Https站点教程

    https://blog.csdn.net/tanga842428/article/details/79273226 Http站点转Https站点教程 2018年02月28日 12:04:35 坦GA ...

  7. acdream 20140730 D题

    今天见识到了“数学上来先打表”............ #include<iostream> using namespace std; #include<iomanip> #d ...

  8. bootstrap基础学习小记(三)网格简介

    网格系统:网格系统的实现原理非常简单,仅仅是通过定义容器大小,平分12份(也有平分成24份或32份,但12份是最常见的),再调整内外边距,最后结合媒体查询,就制作出了强大的响应式网格系统.Bootst ...

  9. C# 开发代码标准

    开发标准文件 文件名称:C#开发规范 版 本:V2.0 前言 目的是为了规范每个人的编程风格,为确保系统源程序可读性,从而增强系统可维护性,制定下述编程规范,以规范系统各部分编程.系统继承的其它资源中 ...

  10. Tomcat 启动成功后报 INFO [Timer-0] org.apache.catalina.loader.WebappClassLoaderBase.checkStateForResourceLoading Illegal access:

    Tomcat 启动成功后报 INFO [Timer-0] org.apache.catalina.loader.WebappClassLoaderBase.checkStateForResourceL ...