KMP 算法中对 next 数组的理解

next 数组的意义

此处 next[j] = k;则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同;

next[j] 表示当位置 j 的字符串与主串不匹配时,下一个需要和主串比较的字串位置在 next[j] 处;有下图:

若当前位置 j 与主串某一个字符不匹配,则下一次比较的是 K 与主串的当前位置,这个 K 也就是next[j];由于两个浅蓝色区域相同,因此 K 前面的区域肯定与主串相同,不需比较;如下图:

由上图可知,K 前面的区域不需比较;

next 数组的推导

从 next 数组所表达的意义可知,我们要求 next[j],首先要找到一个 K,这个 K 前面的浅蓝色区域和 j 前面的浅蓝色区域相同;如下图:

根据规定 next[1] = 0;接下来求其他的 next[j];

对于 next[2] 可得其必然为 next[2] = 1;

如下图:当第二个元素不匹配时,j 将退回到 1 处进行比较,因此 next[2] 一定为 1;

接下来是一般情况的推导,此处使用递推法进行推导,即已知 next[j] 求 next[j + 1];

若 next[j] = k 则有下图:

由于 next[j = k,可知浅蓝色部分相同;接下来分两种情况讨论;

  • ch[K] == ch[j],这种情况时,可以得到下图;

由图可知:对于 j + 1,能够找到一个 K + 1 使得有浅蓝色区域相同,那么当 j + 1 不匹配时,下一次将比较 K + 1 和主串;因此 next[j + 1] = K + 1 = next[j] + 1;

  • ch[K] != ch[j],这种情况就变的复杂,这也是整个 KMP 算法中最难理解的部分;

    从本节的开头可以知道,求 next[j + 1] 最关键的一点在于求 j + 1 之前有多长的后缀和前缀匹配,即找出多大的浅蓝色区域匹配;我们现在面对的图如下:

我们的目的是找到一个 K1 使得出现下列情况:找到 K1 使得浅蓝色部分相同;

要想浅蓝色部分相同,分为两个部分,使得 1 和 2 相同,使得 K1 和 j 相同;

想要让 1 和 2 相同是难以比较的,但是可以转化为另一个问题,如下图:

想要找出 1 和 3 相同的区域,等价与找到 1 和 2 相同的区域;为什么呢?因为 next[j] = K,因此 j 前面与 K 前面相同如下图:

这个等价关系非常重要,是这部分推导的关键;将其单独抽离出来如下图:

那么如何得到 K1 使得 1 和 2 相同呢?回到文首 next[j] 所表示的意义,next[j] = k;则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同 而 next[K] 是在 j 前面的是已知的,因此可得 K1 = next[K],此时得到的 K1 即可满足 1 和 3 相同;

到此就解决了 1 和 3 相等的问题,直接比较 K1 和 j 若两者相同,则可得到下图;

那么 next[j + 1] = K1 + 1 = next[K] + 1 = next[next[j]] + 1;

那么若 ch[j] != ch[K1] 呢?那么就又演化为如下问题:

这个图和本小节开始的图相同,那么按照此方法解决即可;

可得结果:next[j + 1] = next[K1] + 1 = next[next[K]] + 1 = next[next[next[j]]] + 1

若下一次 K2 依然和 j 不相等,那么又接着递归即可;一直到 Kn = 0;

一个例子

接下来使用上面的结论来计算一个字符串的 next 数组;

有数组 ababaaababaa 转化为如下表:

S a b a b a a a b a b a a
编号 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2 3 4 5 6

按如下顺序填表的 next 栏:

  • 对于 next[1] 规定为 0,根据前面的分析:next[2] = 1;
  • 对于 next[3],则观察 2 和 next[2] = 1,即 b 和 a,不相等;而next[next[2]] = 0,因此 next[3] = 1;
  • 对于 next[4],观察 3 和 next[3] = 1,即 a 和 a,相等,故 next[4] = next[3] + 1 = 2;
  • 对于 next[5],观察 4 和 next[4] = 2,即 b 和 b,相等,故 next[5] = next[4] + 1 = 3;
  • 对于 next[6],观察 5 和 next[5] = 3,即 a 和 a,相等,故 next[6] = next[5] + 1 = 4;
  • 对于 next[7],观察 6 和 next[6] = 4,即 a 和 b,不相等,next[next[6]] = 2,与 6 比较即 b 和 a,不相等,继续递归 next[next[next[6]]] = next[next[4]] = next[2] = 1;比较 1 和 6 即 a 和 a,相等,因此 next[6] = next[next[next[6]] + 1 = 2;
  • 对于 next[8],观察 7 和 next[7] = 2,即 a 和 b,不相等,next[next[7]] = 1,1 和 7相等,因此 next[8] = next[next[7]] + 1 = next[2] + 1 = 2;
  • 对于 next[9],观察 8 和 next[8] = 2,即 b 和 b,相等,故 next[9] = next[8] + 1 = 3;
  • 对于 next[10],观察 9 和 next[9] = 1,即 a 和 a,相等,故 next[10] = next[9] + 1 = 4;
  • 对于 next[11],观察 10 和 next[10] = 2,即 b 和 b,相等,故 next[11] = next[10] + 1 = 5;
  • 对于 next[12],观察 11 和 next[11] = 3,即 a 和 a,相等,故 next[12] = next[11] + 1 = 6;

通过以上分析得到的获取 next 数组的代码如下:

  1. void get_next(String T, int next[]) {
  2. int k = 0, j = 1;
  3. next[1] = 0;
  4. while (j < T.length)
  5. {
  6. if(k == 0 || T.ch[k] == T.ch[j]) {
  7. k++;
  8. j++;
  9. next[j] = k;
  10. } else {
  11. k = next[k];
  12. }
  13. }
  14. }

那么接下来的 KMP 算法代码就比较容易了:

  1. int KMP(String S, String T, int next[]) {
  2. int i = 1, j = 1;
  3. while (i <= S.length && j <= T.length)
  4. {
  5. if(j == 0 || S.ch[i] == T.ch[j]) {
  6. i++;
  7. j++;
  8. } else {
  9. j = next[j];
  10. }
  11. }
  12. if(j > T.length) {
  13. return i - T.length;
  14. } else {
  15. return 0;
  16. }
  17. }

测试代码如下:

  1. #include<iostream>
  2. using namespace std;
  3. const int MAX = 255;
  4. typedef struct {
  5. char ch[MAX];
  6. int length;
  7. } String;
  8. void InitiString(String &s, char chars[]) {
  9. int len = 0;
  10. while(chars[len] != '\0') {
  11. s.ch[len + 1] = chars[len];
  12. len++;
  13. }
  14. s.length = len;
  15. }
  16. void get_next(String T, int next[]) {
  17. int k = 0, j = 1;
  18. next[1] = 0;
  19. while (j < T.length)
  20. {
  21. if(k == 0 || T.ch[k] == T.ch[j]) {
  22. k++;
  23. j++;
  24. next[j] = k;
  25. } else {
  26. k = next[k];
  27. }
  28. }
  29. }
  30. int KMP(String S, String T, int next[]) {
  31. int i = 1, j = 1;
  32. while (i <= S.length && j <= T.length)
  33. {
  34. if(j == 0 || S.ch[i] == T.ch[j]) {
  35. i++;
  36. j++;
  37. } else {
  38. j = next[j];
  39. }
  40. }
  41. if(j > T.length) {
  42. return i - T.length;
  43. } else {
  44. return 0;
  45. }
  46. }
  47. int main() {
  48. char char1[20] = "aabaabaabaac";
  49. char char2[20] = "aabaac";
  50. String S, T;
  51. InitiString(S, char1);
  52. InitiString(T, char2);
  53. int next[MAX];
  54. get_next(T, next);
  55. int index = KMP(S, T, next);
  56. printf("%d", index);
  57. return 0;
  58. }

输出结果:

  1. 7

KMP 算法中的 next 数组的更多相关文章

  1. KMP算法中求next数组的实质

    在串匹配模式中,KMP算法较蛮力法是高效的算法,我觉得其中最重要的一点就是求next数组: 看了很多资料才弄明白求next数组是怎么求的,我发现我的忘性真的比记性大很多,每次看到KMP算法求next数 ...

  2. kmp算法中的next数组实例解释

    假设求串′ababaaababaa′的next数组 模式串 a b a b a a a b a b a a 下标 1 2 3 4 5 6 7 8 9 10 11 12 1.前两位:next数组前两位一 ...

  3. KMP算法中的next数组求解示意图

  4. 数据结构KMP算法中手算next数组

    总结一下今天的收获(以王道数据结构书上的为例子,虽然我没看它上面的...):其中竖着的一列值是模式串前缀和后缀最长公共前缀. 最后求得的结果符合书上的结果,如果是以-1开头的话就不需要再加1,如果是以 ...

  5. KMP算法中我对获取next数组的理解

    之前在学KMP算法时一直理解不了获取next数组的函数是如何实现的,现在大概知道怎么一回事了,记录一下我对获取next数组的理解. KMP算法实现的原理就不再赘述了,先上KMP代码: 1 void g ...

  6. 问题 1690: 算法4-7:KMP算法中的模式串移动数组

    题目链接:https://www.dotcpp.com/oj/problem1690.html 题目描述 字符串的子串定位称为模式匹配,模式匹配可以有多种方法.简单的算法可以使用两重嵌套循环,时间复杂 ...

  7. KMP算法中next数组的理解与算法的实现(java语言)

    KMP 算法我们有写好的函数帮我们计算 Next 数组的值和 Nextval 数组的值,但是如果是考试,那就只能自己来手算这两个数组了,这里分享一下我的计算方法吧. 计算前缀 Next[i] 的值: ...

  8. 关于KMP算法中,获取next数组算法的理解

    参考:KMP入门级别算法详解--终于解决了(next数组详解) https://blog.csdn.net/lee18254290736/article/details/77278769 在这里讨论的 ...

  9. KMP算法中next数组的构建

    记得初学$kmp$的时候 老师让大家把它直接背下来 然而不理解的话 不仅调试起来比较慢 很多题目也难往$kmp$上想 ----------------------------------------- ...

随机推荐

  1. 突然发现,npm里request依赖包已经弃用,怎么办?

    摘要:在npm官网查看了request依赖包的当前状态,果然在2020年就被弃用了. 本文分享自华为云社区<npm里request依赖包已经弃用?致敬并调研替代方案!>,作者: gentl ...

  2. netty系列之:Bootstrap,ServerBootstrap和netty中的实现

    目录 简介 Bootstrap和ServerBootstrap的联系 AbstractBootstrap Bootstrap和ServerBootstrap 总结 简介 虽然netty很强大,但是使用 ...

  3. java集合专题 (ArrayList、HashSet等集合底层结构及扩容机制、HashMap源码)

    一.数组与集合比较 数组: 1)长度开始时必须指定,而且一旦指定,不能更改 2)保存的必须为同一类型的元素 3)使用数组进行增加/删除元素-比较麻烦 集合: 1)可以动态保存任意多个对象,使用比较方便 ...

  4. Python数据分析 | Numpy与1维数组操作

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/33 本文地址:http://www.showmeai.tech/article-det ...

  5. QT通过静态库调用Go

    ## 编写Go代码 package main import( "fmt" "C" ) //export test func test(str *C.char) ...

  6. 【C#设计模式】里氏替换原则

    今天,我们再来学习 SOLID 中的"L"对应的原则:里式替换原则. 里氏替换原则 里氏替换原则(Liskov Substitution Principle):派生类(子类)对象能 ...

  7. python爬虫之抓取小说(逆天邪神)

    2022-03-06 23:05:11 申明:自我娱乐,对自我学习过程的总结. 正文: 环境: 系统:win10, python版本:python3.10.2, 工具:pycharm. 项目目标: 实 ...

  8. Qt:QWebChannel

    0.说明 QWebChannel的作用是将QObject展示给的HTML客户. QWebChannel是连接C++应用和HTML/JS应用的桥梁.通过把一个QObject传入QWebChannel并在 ...

  9. (三)目标检测算法之SPPNet

    今天准备再更新一篇博客,加油呀~~~ 系列博客链接: (一)目标检测概述 https://www.cnblogs.com/kongweisi/p/10894415.html (二)目标检测算法之R-C ...

  10. 矩池云上使用nohup和&让任务后台运行

    1.nohup 用途:不挂断地运行命令. 语法:nohup Command [ Arg - ] [ & ] 无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup ...