（一）获取模式串T的next数组值

1.回顾

我们所知道的KMP算法next数组的作用

next[j]表示当前模式串T的j下标对目标串S的i值失配时，我们应该使用模式串的下标为next[j]接着去和目标串失配的i值进行匹配

而KMP算法的next求值函数

我们可以知道next除了j=1时，next[1]为0，其他情况都是比较前缀和后缀串的相似度（第三种情况是当相似度为0时，next值为0+1=1）

next数组，是用来评判前后缀的相识度，而next值，则是等于相似度加一

2.思考

虽然我们知道是比较前后缀的相似度，但是我们如何确定前后缀位置来获取next值。---->pj的next值取决于 前缀p1p2....pk-1　后缀pj-k+1.....pj-1  的相似度，next值是相似度加一

pj的next值取决于 前缀p1p2....pk-　后缀pj-k+.....pj-  的相似度，是相似度加一。

我们将k-1=m,其中m就是相似度，k就是next数组值-->Max{K}

pj的next值取决于 前缀p1p2....pm　后缀pj-m.....pj-1  的相似度，是相似度加一。
那么我们现在的任务，就由找k-1变为找m，找相似度

例如：

虽然我们可以直接看出abab的相似度是2，

也可以编写函数获取到其相似度,

而且当我们求下一个next值时，串变为ababa，这时我们也可以看出相似度为3，使用同一个函数可以实现获取到相似度。

但是我们这个函数大概就是从头或尾开始索引，进行判断。

每次我们获取到了子串都要交给这个函数从头到尾去索引获取相似度，似乎不划算，我们是不是应该有更好的方法增加程序的性能？

3.下面我们尝试获取下面的T串的所有next值，从中找到关联

步骤一：由上一篇博文可以知道前j1,j2前两个的next是固定值为0，1

步骤二：获取j=3时的next，此时子串只有'ab'，所以子串的前缀只能选择'a',后缀只能选择'b';下面我们对前后缀进行匹配

next数组，是用来评判前后缀的相识度，而next值，则是等于相似度加一

next[j]表示当前模式串T的j下标对目标串S的i值失配时，我们应该使用模式串的下标为next[j]接着去和目标串失配的i值进行匹配

注意：匹配完毕后后缀会向下加一

步骤三：获取j=4时的next值，此时子串为'aba'，子串中前缀是p1..pm,后缀是pm+1..pj-1，若是m取一，此时子串的前缀可以选择p1，后缀选择p2;若是m=2前缀选择p1p2后缀选择p2p3;那么具体如何选择这个m值呢？

重点：这个m值取决于上次失配时的next[]值，即上次j=3是失配了，所有m=next[3]=1,所以我们选取的前缀为p1='a',后缀为pj-1是'a'

根据匹配处的相似度或者下标J=1都可以得出next[]=

步骤四：获取j=5时的next值，此时子串为'abab'，子串中前缀是p1..pm,后缀是pm+1..pj-1，若是m取一，此时子串的前缀可以选择p1，后缀选择p2;若是m=2前缀选择p1p2后缀选择p2p3,若m取3，前缀为p1p2p3后缀为p2p3p4;那么具体如何选择这个m值呢？

重点：若是上次匹配成功。并未失配，那么我们的m值在上一次的基础上加1。所以这次m=2,我们选取前缀p1p2和后缀p3p4

根据匹配处的相似度或者下标J=2都可以得出next[]=

步骤五：获取j=6时的next值，此时子串为'ababa'，子串中前缀是p1..pm,后缀是pm+1..pj-1，因为前面匹配成功，所有m++,m=3所以前缀为p1p2p3,后缀为p3p4p5

因为前面匹配成功，所有m++,m=3所以前缀为p1p2p3,后缀为p3p4p5

根据匹配处的相似度或者下标J=3都可以得出next[6]=4

步骤六：获取j=7时的next值，此时子串为'ababaa'，子串中前缀是p1..pm,后缀是pm+1..pj-1，因为前面匹配成功，所有m++,m=4所以前缀为p1p2p3p4,后缀为p3p4p5p6

根据匹配处的相似度或者下标J=1都可以得出next[]=

步骤七：获取j=8时的next值，此时子串为'ababaaa'，由于上面失配了，所以m=next[7]=2,所以我们前缀为p1p2,后缀为p6p7

由于上面失配了，所以m=next[]=,匹配前缀p1p2,和后缀p6p7

根据匹配处的相似度或者下标J=1都可以得出next[8]=

步骤七：获取j=9时的next值，此时子串为'ababaaab'，由于上面失配了，所以m=next[8]=2,所以我们前缀为p1p2,后缀为p7p8

由于上面失配了，所以m=next[]=,所以我们前缀为p1p2,后缀为p7p8

根据匹配处的相似度或者下标J=2都可以得出next[]=

另一种方案：是直接看匹配位置的j值即可，将j值加一即可，这个是实现程序的时候的使用思路

注意：有可能模式串只有一个字符进行匹配，那么我们之前说的next[]=1也需要我们去匹配一遍，而不是直接获取结果

重点补充：为什么我们可以使用下标值j来表示相似度？

我们以上图为例：

相似度是指前缀串和后缀串之间的相似程度，通过看图，我们不难发现相似度和最后匹配的下标使一样的。

这是因为前缀始终是以下标为一的字符开始匹配，所以匹配到下标为多少，那他的相似度就是多少

4.代码实现

//通过计算返回子串T的next数组

void get_next(String T, int* next)

{

    int m, j;

    j = ;    //j是后缀的末尾下标　　　　　　pj-m...pj-1　　其实j-1就是后缀的下标，而j就是我们要求的next数组下标

    m = ;    //m代表的是前缀结束时的下标，也就是相似度，是等价的　　p1p2...pm

    next[] = ;

    while (j < T[])　　//T[0]是表示串T的长度

    {
　　　　 //这个if,我们只需要考虑，如果我<后缀最后下标>前面匹配成功，现在我T[j]==T[m]也匹配成功，那么我对应的next<++j>数组值是多少？

        if (m ==  || T[m] == T[j])    //T[m]表示前缀的最末尾字符，T[j]是后缀的最末尾字符

        {

            ++m;

            ++j;

            next[j] = m;　　//++j后获取的才是我们要的next[j]下标，我们要获取next[j]处的值，就是获取他前一个匹配时的相似度，也就是前一个匹配的下标+1

        }

        else　　//else是匹配失败的情况，就要进行回溯

            m = next[m];    //若是字符不相同，则m回溯

    }

}

5.测试结果

int main()

{

    int i;

    String s1;

    int next[MAXSIZE] = {  };

    char *str = (char*)malloc(sizeof(char) * );

    memset(str, , );

    printf("enter s1:");

    scanf("%s", str);

    if (!StrAssign(s1, str))

        printf("1.string length is gt %d\n", MAXSIZE);

    else

        printf("1.string StrAssign success\n");

    get_next(s1, next);

    for (i = 1; i <= StringLength(s1); i++)

        printf("%d ", next[i]);

    system("pause");

    return ;

}

数据结构（三）串---KMP模式匹配算法之获取next数组的更多相关文章

【Java】大话数据结构(8) 串的模式匹配算法（朴素、KMP、改进算法）
本文根据<大话数据结构>一书,实现了Java版的串的朴素模式匹配算法.KMP模式匹配算法.KMP模式匹配算法的改进算法. 1.朴素的模式匹配算法为主串和子串分别定义指针i,j. (1)当 ...
大话数据结构(8) 串的模式匹配算法（朴素、KMP、改进算法）
--喜欢记得关注我哟[shoshana]-- 目录 1.朴素的模式匹配算法2.KMP模式匹配算法 2.1 KMP模式匹配算法的主体思路 2.2 next[]的定义与求解 2.3 KMP完整代码 2.4 ...
数据结构（三）串---KMP模式匹配算法
(一)定义由于BF模式匹配算法的低效(有太多不必要的回溯和匹配),于是某三个前辈发表了一个模式匹配算法,可以大大避免重复遍历的情况,称之为克努特-莫里斯-普拉特算法,简称KMP算法 (二)KMP算法 ...
数据结构（三）串---KMP模式匹配算法实现及优化
KMP算法实现 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <stdlib.h> #include ...
数据结构学习：KMP模式匹配算法
有关KMP的算法具体的实现网上有很多,不具体阐述.这里附上c的实现. 谈谈我自己的理解.KMP相较于朴素算法,其主要目的是为了使主串中的遍历参数i不回溯,而直接改变目标串中的遍历参数j. 比如说要是目 ...
线性表-串：KMP模式匹配算法
一.简单模式匹配算法(略,逐字符比较即可) 二.KMP模式匹配算法 next数组:j为字符序号,从1开始. (1)当j=1时,next=0: (2)当存在前缀=后缀情况,next=相同字符数+1: ( ...
[从今天开始修炼数据结构]串、KMP模式匹配算法
[从今天开始修炼数据结构]基本概念 [从今天开始修炼数据结构]线性表及其实现以及实现有Itertor的ArrayList和LinkedList [从今天开始修炼数据结构]栈.斐波那契数列.逆波兰四则运 ...
数据结构- 串的模式匹配算法：BF和 KMP算法
数据结构- 串的模式匹配算法:BF和 KMP算法 Brute-Force算法的思想 1．BF(Brute-Force)算法 Brute-Force算法的基本思想是: 1) 从目标串s 的第一个字 ...
《数据结构》之串的模式匹配算法——KMP算法
//串的模式匹配算法 //KMP算法,时间复杂度为O(n+m) #include <iostream> #include <string> #include <cstri ...

随机推荐

Js_判断浏览器
var isIE=!!window.ActiveXObject;var isIE6=isIE&&!window.XMLHttpRequest;var isIE8=isIE&&a ...
WayOS计费对接（零点计费系统）详细教程
零点计费系统开发也有两年了,一直都是自己和朋友在使用,今年开始有对外免费开发体验的想法,在此简单介绍一下wayos和零点计费的对接教程. 可到官网www.feidian8.com里面的首页点击查看零点 ...
高精度乘法--C++
高精度乘法--C++ 模仿竖式乘法,在第一步计算的时候将进位保留,第一步计算完再处理进位.(见代码注释) 若要处理正负情况,可在数据输入后加以判断,处理比较简单. 小数计算也可参照该方法,不过对齐方式 ...
Fabric Dev开发调试模式的搭建过程
在利用Fabric开发Chaincode的时候,调试Chaincode显得尤为不方便,因为Chaincode正常应该运行在Docker容器中,每次修改Chaincode后想要使其更改生效必须得对Cha ...
Redis学习笔记之单机实现
1.数据库 Redis的所有数据库都保存在redisServer.db数组中,数据库主要是由两个字典组成:dict字典,负责保存键值对:expires,负责保存键的过期时间 Redis使用惰性删除和定 ...
《在kali上完成gdb调试》
kali使用流程 1.使menuos停止方法如图: 效果如图: 2.启动调试打开一个新的命令行,然后方法如下图: 3.设置断点注:由图可看出,断点设置在sys_clone,dup_task_st ...
Visual Studio的安装应用及单元测试
新建项目—Visual C#—类库一.Visual Studio的安装这可能是自己安装软件用的的最长时间的一次 ..刚下载完安装的时候灰常的尴尬,因为2013版本和2015的版本都是不支持在win ...
Spring transaction与EJB transaction的关系
TransactionDefinition Interface that defines Spring-compliant transaction properties. Based on the p ...
Jmeter put 方法总结
1.百度到很多关于jmeter put 方法的使用 ,但觉得都完全下面我大致总结下 : >1.放入 url 中如:www.*****.com?a=1&b=2 ; >2.放入到p ...
怎么判断pagecontrol下的TabSheet是否打开还是关闭求答案
if pagecontrol.activepage=TabSheet1 then是在当前显示页------解决方案------------------------------------------- ...

数据结构（三）串---KMP模式匹配算法之获取next数组

（一）获取模式串T的next数组值

1.回顾

我们所知道的KMP算法next数组的作用

而KMP算法的next求值函数

2.思考

3.下面我们尝试获取下面的T串的所有next值，从中找到关联

步骤一：由上一篇博文可以知道前j1,j2前两个的next是固定值为0，1

步骤二：获取j=3时的next，此时子串只有'ab'，所以子串的前缀只能选择'a',后缀只能选择'b';下面我们对前后缀进行匹配

步骤三：获取j=4时的next值，此时子串为'aba'，子串中前缀是p1..pm,后缀是pm+1..pj-1，若是m取一，此时子串的前缀可以选择p1，后缀选择p2;若是m=2前缀选择p1p2后缀选择p2p3;那么具体如何选择这个m值呢？

步骤五：获取j=6时的next值，此时子串为'ababa'，子串中前缀是p1..pm,后缀是pm+1..pj-1，因为前面匹配成功，所有m++,m=3所以前缀为p1p2p3,后缀为p3p4p5

步骤六：获取j=7时的next值，此时子串为'ababaa'，子串中前缀是p1..pm,后缀是pm+1..pj-1，因为前面匹配成功，所有m++,m=4所以前缀为p1p2p3p4,后缀为p3p4p5p6

步骤七：获取j=8时的next值，此时子串为'ababaaa'，由于上面失配了，所以m=next[7]=2,所以我们前缀为p1p2,后缀为p6p7

步骤七：获取j=9时的next值，此时子串为'ababaaab'，由于上面失配了，所以m=next[8]=2,所以我们前缀为p1p2,后缀为p7p8

重点补充：为什么我们可以使用下标值j来表示相似度？

4.代码实现

5.测试结果

数据结构（三）串---KMP模式匹配算法之获取next数组的更多相关文章

随机推荐

热门专题