之前在学KMP算法时一直理解不了获取next数组的函数是如何实现的,现在大概知道怎么一回事了,记录一下我对获取next数组的理解。

  KMP算法实现的原理就不再赘述了,先上KMP代码:

 1 void getNext(char *pat, int *next) {
2 next[0] = -1;
3 int m = strlen(pat);
4 for (int i = 1; i < m; i++) {
5 int j = next[i - 1];
6 while (j != -1 && pat[j] != pat[i - 1]) {
7 j = next[j];
8 }
9 next[i] = j + 1;
10 }
11 }
12
13 int KMP(char *str, char *pat) {
14 int n = strlen(str), m = strlen(pat);
15 int next[m];
16 getNext(pat, next);
17
18 int i = 0, j = 0;
19 while (i < n && j < m) {
20 if (j == -1 || str[i] == pat[j]) i++, j++;
21 else j = next[j];
22 }
23
24 return j == m ? i - j : -1;
25 }

  先说明,为了描述更清晰,我特意在主串和模式串后面紧接str,pat,s,p等标识,以区分不同的主串和模式串。

  我对next数组的定义是这样的,next[j]存放的值是模式串pat的某个位置,而这个位置是:在匹配过程中,模式串pat在 j 这个位置发生失配时,接下来要与主串str进行匹配的位置。也就是说next[j]存放的值是模式串pat在 j 这个位置发生失配时回退到的位置,然后从这个位置开始继续与主串str比较。

  而根据KMP算法的定义,当发生失配时,主串的指针 i 不需要移动,而只需要移动模式串pat的指针 j 。这是因为主串str和模式串pat有部分是相同的,也就是在模式串pat中,next[j]这个位置之前的部分(不包括next[j]这个位置)和主串str在 i 位置之前对应的部分(不包括i这个位置)是相同的。

  而要获取模式串pat每个位置对应的next值,一个很重要的思想是,把模式串pat既看作是主串s,也看作是模式串p。这里所说的主串s和模式串p都是指同一字符串——模式串pat。

  所以如果我们要获取模式串pat中某个位置 i 的next值,可以理解为当模式串pat在 i 这个位置发生失配时,应该回退到的那个位置,也就是next[i]这位置。

  这时,我们把模式串pat从 0 到 i 这部分暂时理解为主串s,然后把模式串pat最前面的部分也就是从 0 到某个位置 j (其中j < i - 1)这部分理解为模式串p。我们要得到next[i],就要知道 j 这个位置,使得模式串p从位置 0 到 j ,与主串s从位置 i - 1 开始之前的相同数量(j + 1)的那部分完全匹配。也就是满足 p0 p1 ... pj == si-1-j si-j ... si-1 。所以,在匹配时,当模式串pat在 i 这个位置发生失配,就可以回退到 j + 1 这个位置,再从 j + 1 这个位置继续与主串str比较。这样,就知道 next[i] = j + 1 。

  举个例子:

  怎么去找到模式串p中 j 那个位置呢?其实很简单,一开始就为 j 赋初值 j = next[i - 1] 。这里再重复一遍,next[i - 1]是模式串pat在 i - 1 这个位置发生失配时,应该回退到的位置。接着我们比较判断模式串pat在 i - 1 这个位置的字符是否与在 j 这个位置的字符相同。也就是主串s在 i - 1 这个位置是否与模式串p在 j这个位置的字符相同。即 pat[i - 1] == pat[j] ? 或是 s[i - 1] == p[j] ? 。

  如果相同,那么直接就有 next[i] = j + 1 。否则我们可以理解为模式串p在 j 这个位置发生失配,就要进行回退。回退到哪里呢?当然是回退到next[j]了。所以说,如果发生失配,模式串p的指针j就一直回退,即有 j = next[j] ,直到满足i - 1这个位置与j这个位置的字符相同,才停止回退匹配,然后同样有会 next[i] = j + 1 。

  想一下,如果在回退的过程中,始终没有发现匹配成功的情况,难道一直这样回退下去吗?答案肯定不是的。我们有个终止条件,就是一开始就规定 next[0] = -1 ,意味着当在模式串pat在 0 这个位置,都与不能够与主串str匹配,那么就没有再可以回退的位置了,这时主串str的指针与模式串pat的指针都要向后移动1位,然后继续匹配。

  所以当发现 j == -1 时,就停止回退,说明当模式串pat在 i 这个位置发生失配时,只能够回退到 0 这个位置继续与主串str匹配。同时让主串s指针 i 与模式串p指针 j 同时向后移动1位。这时主串s指针在 i + 1 这个位置,模式串p指针在 j + 1 这个位置,也就是 0 这个位置,然后继续求后面位置的next值。

  好了,现在我已经把我对KMP算法中获取next数组的理解表述完了,我们回到代码中看看。

 1 void getNext(char *pat, int *next) {
2 next[0] = -1; // 一开始确定回退最终条件
3 int m = strlen(pat);
4
5 // 把模式串pat同时看作主串s和模式串p
6 for (int i = 1; i < m; i++) { // i就是主串s的指针
7 int j = next[i - 1]; // j就是模式串p的指针
8
9 // 我们就是要找到模式串p的某个位置j,使得模式串p从0到j这部分,与主串s从位置i - 1到前面的i - 1 - j的那部分完全匹配 
10 while (j != -1 && pat[j] != pat[i - 1]) { // 只要j != -1,也就是还可以回退,同时与主串s的i - 1这个位置不匹配
11 j = next[j]; // j就一直回退
12 }
13
14 // 其中如果因为j == -1而退出循环,意味着找不到可以匹配的位置,则模式串pat在i这个位置发生失配时,只能够回退到最开始的位置0
15 next[i] = j + 1; // 不管最后是因为匹配成功还是无法回退而退出循环的,都有next[i] = j + 1
16 }
17 }

  还有另外一种写法,是大多数人的写法,其实实现的原理与我上述的几乎相同,只不过代码写起来不同,效率也相差不多,只不过每轮循环时,下面的代码会比上面的代码少了次 j = next[i - 1] 的赋值操作。

 1 void getNext(char *pat, int *next) {
2 next[0] = -1;
3 int m = strlen(pat);
4
5 // 这里的i并不是我们要求的next[i]中的那个i,而是要求next值那个位置的前一个位置
6 // 这里的j和上面代码的j相同,都是使得从0到j这部分,与从上面的那个i开始到i - j的那部分完全匹配 
7 for (int i = 0, j = -1; i < m - 1; ) { // 由于这里的i是指要求next值那个位置的前一个位置,所以i最大为m - 2
8
9 // 如果发现匹配,就知道i的下一个位置i + 1的next值,也就是next[i + 1] = j + 1
10 // 如果j无法回退,i + 1的next值就为0,同样可以表示为next[i + 1] = j + 1
11 // 每次得到next[i + 1],都会从++后的位置,也就是i + 1和j + 1这个位置继续接下来的匹配
12 if (j == -1 || pat[i] == pat[j]) next[++i] = ++j;
13 else j = next[j]; // 失配j就回退
14 }
15 }

KMP算法中我对获取next数组的理解的更多相关文章

  1. 问题 1690: 算法4-7:KMP算法中的模式串移动数组

    题目链接:https://www.dotcpp.com/oj/problem1690.html 题目描述 字符串的子串定位称为模式匹配,模式匹配可以有多种方法.简单的算法可以使用两重嵌套循环,时间复杂 ...

  2. KMP 算法中的 next 数组

    KMP 算法中对 next 数组的理解 next 数组的意义 此处 next[j] = k:则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同: next[j] 表示当位置 j 的字符串与主串不匹 ...

  3. 关于KMP算法中,获取next数组算法的理解

    参考:KMP入门级别算法详解--终于解决了(next数组详解) https://blog.csdn.net/lee18254290736/article/details/77278769 在这里讨论的 ...

  4. KMP算法中next数组的理解与算法的实现(java语言)

    KMP 算法我们有写好的函数帮我们计算 Next 数组的值和 Nextval 数组的值,但是如果是考试,那就只能自己来手算这两个数组了,这里分享一下我的计算方法吧. 计算前缀 Next[i] 的值: ...

  5. KMP算法中求next数组的实质

    在串匹配模式中,KMP算法较蛮力法是高效的算法,我觉得其中最重要的一点就是求next数组: 看了很多资料才弄明白求next数组是怎么求的,我发现我的忘性真的比记性大很多,每次看到KMP算法求next数 ...

  6. KMP算法中next数组的构建

    记得初学$kmp$的时候 老师让大家把它直接背下来 然而不理解的话 不仅调试起来比较慢 很多题目也难往$kmp$上想 ----------------------------------------- ...

  7. KMP算法中的几个疑问

    KMP算法next数组求解实现 首先我们通过应用场景将KMP算法中用到的名词做一个说明: 在一个字符串(string1)中查询是否存在另一个字符串(string2). 在字符串匹配算法中,我们通常将字 ...

  8. KMP算法中next函数的理解

    首先要感谢http://blog.csdn.net/v_july_v/article/details/7041827以及http://blog.chinaunix.net/uid-27164517-i ...

  9. KMP算法番外篇--求解next数组

    KMP算法实现字符串的模式匹配的时间复杂度比朴素的模式匹配好很多,但是它时间效率的提高是有前提的,那就是:模式串的重复率很高,不然它的效率也不会凸显出来.在实际的应用中,KMP算法不算是使用率很高的一 ...

随机推荐

  1. NTP时间同步服务

    NTP时间服务器 作用:ntp主要是用于对计算机的时间同步管理操作. 时间是对服务器来说是很重要的,一般很多网站都需要读取服务器时间来记录相关信息,如果时间不准,则可能造成很大的影响. 部署安装NTP ...

  2. Salesforce学习之路(十)Aura组件工作原理

    很喜欢曾经看到的一句话:以输出倒逼输入.以输出的形式强制自己学习,确实是高效的学习方式,真的很棒.以下仅为个人学习理解,如有错误,欢迎指出,共同学习. 1. 什么是Lightning Componen ...

  3. Spring Cloud Alibaba(2)---RestTemplate微服务项目

    RestTemplate微服务项目 前言 因为要运用 Spring Cloud Alibaba 开源组件到分布式项目中,所以这里先搭建一个不通过 Spring Cloud只通过 RestTemplat ...

  4. JAVAEE_02_BS/CS架构

    BS/CS架构 系统构架分为? C/S: Client/Server B/S: Browser/Server B/S的优缺点? 优点: 1. 不需要安装特定的客户端软件,只需要浏览器. 2. 升级只需 ...

  5. 使用IDEA模拟git命令使用的常见场景

    目录 使用IDEA模拟git命令使用的常见场景 前期准备 新建一个远程仓库 在一个文件夹内建立两个子文件夹作为两个本地仓库的存放位置 本地仓库与远程仓库建立联系 模拟两个用户协同开发的场景(使用IDE ...

  6. hdu3756 三分求最小圆锥

    题意:       让你找到一个最小的圆柱去覆盖所有的竖直的线段.. 思路:       三分,直接去三分他的半径,因为想下,如果某个半径是最优值,那么 从R(MAX->now->MIN) ...

  7. POJ 3228 二分最大流

    题意:       给你N个位置,每个位置都有金矿数量和仓库数量,然后位置和位置之间的距离给了出来,最后问你吧所有的金矿都放到库里面走的路径 最长的最短 是多少? 思路:      比较简单的一个题, ...

  8. Python 爬虫 BeautifulSoup4 库的使用

    BeautifulSoup4库 和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据.lxml 只会局部遍历,而Be ...

  9. 2020腾讯Android岗初级到高级面试真题收录解析

    前言 马上就要到金九银十面试季了,需要找工作的小伙伴可以开始刷题复习了. 今天给大家分享的是博主腾讯面试的面经以及对腾讯2020上半年Android开发岗面经真题收录,希望可以帮助到大家,喜欢的朋友可 ...

  10. InnoDB存储引擎简介

    前言: 存储引擎是数据库的核心,对于 MySQL 来说,存储引擎是以插件的形式运行的.虽然 MySQL 支持种类繁多的存储引擎,但最常用的当属 InnoDB 了,本篇文章将主要介绍 InnoDB 存储 ...