前言

KMP算法是一种字符串匹配算法,其重中之重是next数组的构建,其代码的简洁与神奇使其广受关注。

但不难发现,acm中学到的KMP和数据结构里面学到的KMP并不一样o(︶︿︶)o

之前我写过acm版的KMP,戳这里

现在写一篇数据结构版的KMP,便于应对即将到来的数据结构考试(艹

手撕next数组

先来复习一下acm版next数组:next[i]是部分匹配值,也就是前缀和后缀的最长共有元素的长度

而数据结构版的next数组指的是当匹配失效的时候,匹配串的 j 指针应该指向的位置(即next[j])

这两种本质上来说,失配的时候都是指向next[j],但是由于acm输入的字符串的下标是从0开始,而数据结构都是从1开始,所有会有差别滴

这里主要介绍在考试的时候给你一个字符串时如何快速滴手撕next数组

先看一下next数组的公式:

这种鸟公式傻子才用

正解:

  • 首先对于前两个:next[1] = 0; next[2] = 1;(注意,下标从1开始)
  • 后面每一位的next值求解:根据前一位进行比较
    • 将前一位的字符 与前一位的next值作为下标对应的字符进行比较
    • 相等,则该位的next值就是前一位的next值加上1
    • 不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值
    • 若找到第一位都不匹配,则改为的next值为1。

举个例子:abaabcac

  1. next[1] = 0

  2. next[2] = 1

  3. 求next[3] 则去判断前一位的字符与前一位的next对应的字符,发现不相同,此时已经匹配到了第一位,还不相同,则next值为1

    S[2] != S[next[2]], 且匹配到了第一位,故next[3] = 1

    aba

    [0, 1, 1]

  4. 求next[4]则去判断前一位字符a 与 前一位next[3] 对应的字符a比较,发现相同,则next[4] = next[3] + 1 = 2

    S[3] = S[next[3]], 故S[4] = S[3] + 1 = 2

    abaa

    [0, 1, 1, 2]

  5. 求next[5] 则去判断前一位(4)的a与前一位(4)的next[4]对应的字符b相比,发现不同,就继续用前一位(4)的字符a 与 next[4]对应的字符的next值(2)对应的字符a比较,发现相同,则next[5] = next[next[4]] + 1, 也就是next[5] = next[2] + 1 = 2

    S[4] != S[next[4]] --->. S[4] = S[next[next[4]]], 故 next[5] = next[next[4]] + 1 = 2

    abaab

    [0, 1, 1, 2, 2]

  6. 求next[6] 则去判断第五位的b与第五位的next值对应的字符b,发现相同,则next[6] = next[5] + 1

    S[5] = S[next[5]], 故next[6] = next[5] + 1 = 3

    abaabc

    [0, 1, 1, 2, 2, 3]

  7. 求next[7] 则去判断第6位的c与第next[6]位对应的字符,发现不同,就拿第6位的c与第next[next[6]]对应的 a 相比, 发现不同,且匹配到了第一位,故next[7] = 1

    S[6] != S[next[6]]--->next[6] != S[next[next[6]]], 且next[next[6]] = 1,即匹配到第一位还不同,则next[7] = 1

    abaabca

    [0, 1, 1, 2, 2, 3, 1]

  8. 求next[8] 则去判断第7位的a 与 next[7]对应的a比较, 发现相同,则next[8] = next[7] + 1

    S[7] = S[next[7]], 故next[8] = next[7] + 1 = 2

    abaabcac

    [0, 1, 1, 2, 2, 3, 1, 2]

手撕nextval数组

nextval数组是对next数组的优化版

例如:

匹配串S:aaaab

模式串T:aaabaaaab

匹配串的 next[] = {0,1, 2, 3, 4}

当匹配串与模式串在第四个位置失配时,指向模式串的 i 是不变的,指向匹配串的 j 是需要变成next[j] ,就需要将 T[4] 与 S[3]进行比较,会发现,还是不同,就让指针 j 继续跳,一值下去,会发现 T[4] 与 S[3] S[2] S[1] 都进行了比较,但我们之间观察的话会发现,S[1] = S[2] = S[3] = S[4] = a,根据S[4] != T[4],故S[1] 、S[2] 、S[3] 都不等于T[4],相当于这三次比较毫无卵用,这就是next数组需要优化的地方,故提出了nextval数组来优化

手撕nextval数组有两个方法:

法1.试想法:

试想匹配串S与模式串T在第 i 位(1<= i <= S.size())失配时,看看在最优的情况下,匹配串的头能与模式串的尾能重叠的长度最大为多少,其实也就是偏移量(设S[1] 移动到 i + 1位置表示的偏移量为0,S[1] 移动到 i 位置表示的偏移量为1,以此类推)

拿aaaab举个例子:

  1. nextval[1] = 0

  2. 当第二个字符失配,说明第一个字符是完全相同

    S:aa

    T:aXYYYYYY(X为非a的任意字符, Y为任意字符)

    我们从T的第二位开始与S拿去比较:

    aXYYYY

    aa

    由于X不为a,故匹配失败,继续从T的第三位开始与S进行匹配

    因为从第三位开始都是X,故T有可能是aXaa……,也就能匹配成功,再根据我们上面假设的偏移量的定义,得到偏移量为0

  3. 第三个字符失配与第二个相同, nextval[3] = 0

  4. 第四个字符失配与第二个相同, nextval[4] = 0

  5. 当第五个字符失配时,说明前四个肯定完全相同,故:

    S:aaaab

    T:aaaaXYYYY……(X

    同样的,我们从第二位开始比较,会发现:S[2] = T[2],S[3] = T[3],S[4] = T[4], 对于T[5] 他除了b以外都可以取,所以可以取a,则第五位也可以匹配,就匹配成功

    aaaaXYYYYY

    aaaab

    此时偏移长度为4(偏移串:aaaa)

    故nextval[5] = 4

法2:借助next数组求nextval

总的来说:不同则为next值,想同则继续往前比较,直到找到不同或第一位,跑到了第一个则为0

举个上面讲过的第一个的例子来解释:

abaabcac

next= {0, 1, 1, 2, 2, 3, 1, 2}

  1. nextval[1] = 0
  2. S[2] != S[next[2]], 故nextval[2] = next[2] = 1
  3. S[3] = S[next[3]] ---> 跑到了第一个,故nextval[3] = 0
  4. S[4] != S[next[4]], 故nextval[4] = next[4] = 2
  5. S[5] = S[next[5]] ---> S[next[5]] != S[next[next[5]]], 故S[5] = next[next[5]] = 1
  6. S[6] != S[next[6]], 故 nextval[6] = next[6] = 3
  7. S[7] = S[next[7]], 且跑到了第一个位置,故next[7] = 0
  8. S[8] != S[next[8]],故nextval[8] = next[8] = 2

对于这两种方法,个人感觉法二简单多辽,不过前提是得将next数组算出来,且必须要算的正确,不然直接凉凉(>_<)

这里再贴出next数组和nextval数组的代码:

void getnext(string s){
s = " " + s;//因为next数组从1开始,串从0开始,所以加个空格前缀
int i = 1, j = 0;
nextt[1] = 0;
while (i < s.size()) {
if(j == 0 || s[i] == s[j]){
nextt[++i] = ++j;
}
else j = nextt[j];
}
} void getnextval(string s){
s = ' ' + s;//道理同上
int i = 1, j = 0;
nextval[1] = 0;
while (i < s.size()) {
if(j == 0 || s[i] == s[j]){
++i;++j;
if(s[i] != s[j])nextval[i] = j;
else nextval[i] = nextval[j];
}
else j = nextval[j];
}
}

我绝对不是数据结构课上因为摸鱼没听课,才过来写博客滴⁄(⁄ ⁄ ⁄ω⁄ ⁄ ⁄)⁄

KMP(梅开三度之数据结构详解版的更多相关文章

  1. php开发面试题---php面向对象详解(对象的主要三个特性)

    php开发面试题---php面向对象详解(对象的主要三个特性) 一.总结 一句话总结: 对象的行为:可以对 对象施加那些操作,开灯,关灯就是行为. 对象的形态:当施加那些方法是对象如何响应,颜色,尺寸 ...

  2. redis 五种数据结构详解(string,list,set,zset,hash)

    redis 五种数据结构详解(string,list,set,zset,hash) Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存 ...

  3. 【Redis】redis 五种数据结构详解(string,list,set,zset,hash)

    redis 五种数据结构详解(string,list,set,zset,hash) Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存 ...

  4. 5种Redis数据结构详解

    本文主要和大家分享 5种Redis数据结构详解,希望文中的案例和代码,能帮助到大家. 转载链接:https://www.php.cn/php-weizijiaocheng-388126.html 2. ...

  5. 探索Redis设计与实现6:Redis内部数据结构详解——skiplist

    本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...

  6. 探索Redis设计与实现7:Redis内部数据结构详解——intset

    本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...

  7. 探索Redis设计与实现4:Redis内部数据结构详解——ziplist

    本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...

  8. 【转】Redis内部数据结构详解——ziplist

    本文是<Redis内部数据结构详解>系列的第四篇.在本文中,我们首先介绍一个新的Redis内部数据结构--ziplist,然后在文章后半部分我们会讨论一下在robj, dict和zipli ...

  9. 【转】Redis内部数据结构详解 -- skiplist

    本文是<Redis内部数据结构详解>系列的第六篇.在本文中,我们围绕一个Redis的内部数据结构--skiplist展开讨论. Redis里面使用skiplist是为了实现sorted s ...

随机推荐

  1. Prometheus时序数据库-磁盘中的存储结构

    Prometheus时序数据库-磁盘中的存储结构 前言 之前的文章里,笔者详细描述了监控数据在Prometheus内存中的结构.而其在磁盘中的存储结构,也是非常有意思的,关于这部分内容,将在本篇文章进 ...

  2. herry菌插件(B站C站)下载与安装(更新中)>>

    插件简介: 目前该插件支持chrome浏览器(谷歌浏览器).360极速浏览器等chrome内核的浏览器 最新版插件下载: 点此下载>>>> 安装方法: 1.先下载上面的的插件 ...

  3. 反射的常用API

    反射的常用API 加载程序集 Assembly assembly = Assembly.Load("程序集名称"); // 从前目录加载程序集,提供程序集名称,无后缀 Assemb ...

  4. FPGA的开发板

    板卡架构 板载FPGA(K7-325T)处理24端口10/100/1000M以太网数据: FPGA外挂4Gbit的DDR3颗粒,最大支持800MHz: 板载CPU进行系统配置.管理,并与客户端软件通信 ...

  5. JAVA使用Collator对中文排序

    首先创建一个集合 public static List<String> init() { List<String> list = new ArrayList<String ...

  6. Python内置函数作用及解析

    Python内置的函数及其用法.为了方便记忆,已经有很多开发者将这些内置函数进行了如下分类: 数学运算(7个)    类型转换(24个)    序列操作(8个)    对象操作(7个)    反射操作 ...

  7. LayUi表单模块无法正常显示

    问题: 当我们再使用LayUI的Form表单模块时,我们会把自己需要的表单赋值到我们的页面中,但是会出现无法正常显示的问题,如下: 出现原因: LayUI官方文档也明确表示:"当你使用表单时 ...

  8. 攻防世界 reverser secret-galaxy-300

    secret-galaxy-300 school-ctf-winter-2015 运行程序 完全没有flag的身影呀 ida查看字符串 也没有相关信息 动态调试,看运行后内存信息 发现了一串字符 al ...

  9. 有意思!强大的 SVG 滤镜

    想写一篇关于 SVG 滤镜的文章已久,SVG 滤镜的存在,让本来就非常强大的 CSS 如虎添翼.让仅仅使用 CSS/HTML/SVG 创作的效果更上一层楼.题图为袁川老师使用 SVG 滤镜实现的云彩效 ...

  10. Python3基础之构建setup.py

    技术背景 在上一篇博客中,我们介绍了如何使用pyinstaller将python项目打包成一个可执行文件,并且放在系统目录下,让系统用户可以直接识别到我们构造的项目.而python项目中常见的setu ...