串的模式匹配的一般方法如算法4.5(在bo4-1.cpp 中)所示:由主串S 的第pos 个字

符起,检验是否存在子串T。首先令i 等于

pos(i 为S 中当前待比较字符的位序),j 等于

1(j 为T 中当前待比较字符的位序),如果S 的

第i 个字符与T 的第j 个字符相同,则i、j 各

加1 继续比较,直至T 的最后一个字符(找

到)。如果还没到T 的最后一个字符,比较就

出现了不同(没找到),则令i 等于pos+1,j 等

于1,由pos 的下一个位置起,继续查找是否

存在子串T。这个过程如图410 所示。

在算法4.5 中,主串S 的指针i 总要回溯,特别是在如图410 所示的有较多字符匹

配而又不完全匹配的情况下,回溯得更多。这时,主串S 的一个字符要进行多次比较,显

然效率较低。

如果能使主串S 的指针i 不回溯,在有些情况下效率则会大为提高。这是可以做到

的,因为主串S 中位于i-1,i-2,⋯ 的字符恰和子串T 中位于j-1,j-2,⋯ 的字符相

等,如图410 所示。仍以图410 为例,当S 和T 在第i(终值)个字符处字符不相符

时,i 仍保持在终值处不动,j 回溯到第1 个字符与i 的当前字符继续进行比较。j 回溯到第

几个字符是由子串T 的模式决定的。算法4.7 根据子串T 生成的next 数组指示j 回溯到第

几个字符。next 数组的意义是这样的:如果next[j]=k,当子串T 的第j 个字符与主串S 的

第i 个字符“失配”时,S 的第i 个字符继续与T 的第k 个字符进行比较,T 的第k 个字符

之前的那些字符均与S 的第i 个字符之前的字符匹配。以教科书中图4.5 为例,设子串T

为“abaabcac”。当T 的第5 个字符与S 的第i 个字符失配时,S 的第i-1 个字符一定是a,

和T 的第4 个字符相等。它和T 的第1 个字

符相等。这样,S 的第i 个字符和T 的第2 个

字符开始比较即可。所以, 对于模式串

“abaabcac”,next[5]=2,详见图411。

算法4.7 求子串的数组next[]还有可改

进之处。以图411 为例:如果T 的第5 个

字符与S 的第i 个字符失配,则S 的第i 个字

符一定不是b。这样,尽管S 的第i-1 个字符

是a,和T 的第1 个字符相等,但S 的第i 个字符肯定和T 的第2 个字符b 不相等。所以

可令next[5]=1,使S 的第i 个字符和T 的第1 个字符开始比较。这样使得模式串又向右

移了一位,提高了匹配的效率。算法4.8 是改进的求数组next[](在算法4.8 中的形参是

nextval[])的算法。

算法4.6 是改进的模式匹配算法。它利用算法4.7 或算法4.8 求得的数组next[],提

高了算法的效率。algo4-1.cpp 是实现改进的模式匹配算法的程序。函数get_next()和

get_nextval()分别求得给定的模式串的数组next[]和nextval[],函数Index_KMP()利用数

组next[]或nextval[]求出模式串在主串中的位置。其中,next[j]=0,并不是将主串的当前

字符与模式串的第0 个字符进行比较(模式串也没有第0 个字符),而是主串当前字符的下

一个字符与模式串的第1 个字符进行比较。

// algo4-1.cpp 实现算法4.6、4.7、4.8的程序
#include"c1.h"
#include"c4-1.h"
#include"bo4-1.cpp"
void get_next(SString T,int next[])
{ // 求模式串T的next函数值并存入数组next。算法4.7
int i=1,j=0;
next[1]=0;
while(i<T[0])
if(j==0||T[i]==T[j])
{
++i;
++j;
next[i]=j;
}
else
j=next[j];
}
void get_nextval(SString T,int nextval[])
{ // 求模式串T的next函数修正值并存入数组nextval。算法4.8
int i=1,j=0;
nextval[1]=0;
while(i<T[0])
if(j==0||T[i]==T[j])
{
++i;
++j;
if(T[i]!=T[j])
nextval[i]=j;
else
nextval[i]=nextval[j];
}
else
j=nextval[j];
}
int Index_KMP(SString S,SString T,int pos,int next[])
{ // 利用模式串T的next函数求T在主串S中第pos个字符之后的位置的KMP算法。
// 其中,T非空,1≤pos≤StrLength(S)。算法4.6
int i=pos,j=1;
while(i<=S[0]&&j<=T[0])
if(j==0||S[i]==T[j]) // 继续比较后继字符
{
++i;
++j;
}
else // 模式串向右移动
j=next[j];
if(j>T[0]) // 匹配成功
return i-T[0];
else
return 0;
}
void main()
{
int i,*p;
SString s1,s2; // 以教科书算法4.8之上的数据为例
StrAssign(s1,"aaabaaaab");
printf("主串为");
StrPrint(s1);
StrAssign(s2,"aaaab");
printf("子串为");
StrPrint(s2);
p=(int*)malloc((StrLength(s2)+1)*sizeof(int)); // 生成s2的next数组空间
get_next(s2,p); // 利用算法4.7,求得next数组,存于p中
printf("子串的next数组为");
for(i=1;i<=StrLength(s2);i++)
printf("%d ",*(p+i));
printf("\n");
i=Index_KMP(s1,s2,1,p); // 利用算法4.6求得串s2在s1中首次匹配的位置i
if(i)
printf("主串和子串在第%d个字符处首次匹配\n",i);
else
printf("主串和子串匹配不成功\n");
get_nextval(s2,p); // 利用算法4.8,求得next数组,存于p中
printf("子串的nextval数组为");
for(i=1;i<=StrLength(s2);i++)
printf("%d ",*(p+i));
printf("\n");
printf("主串和子串在第%d个字符处首次匹配\n",Index_KMP(s1,s2,1,p));
}

代码的运行结果如下:

/*
主串为aaabaaaab
子串为aaaab
子串的next数组为0 1 2 3 4
主串和子串在第5个字符处首次匹配
子串的nextval数组为0 0 0 0 4
主串和子串在第5个字符处首次匹配
Press any key to continue
*/

串的模式匹配算法(求子串位置的定位函数Index(S,T,pos))的更多相关文章

  1. 串、串的模式匹配算法(子串查找)BF算法、KMP算法

    串的定长顺序存储#define MAXSTRLEN 255,//超出这个长度则超出部分被舍去,称为截断 串的模式匹配: 串的定义:0个或多个字符组成的有限序列S = 'a1a2a3…….an ' n ...

  2. 【算法】串的模式匹配算法(KMP)

    串的模式匹配算法     问题:         求子串位置的定位函数如何写? int index(SString S,SString T,int pos);         给定串S,子串T,问T在 ...

  3. 数据结构- 串的模式匹配算法:BF和 KMP算法

      数据结构- 串的模式匹配算法:BF和 KMP算法  Brute-Force算法的思想 1.BF(Brute-Force)算法 Brute-Force算法的基本思想是: 1) 从目标串s 的第一个字 ...

  4. 【Java】 大话数据结构(8) 串的模式匹配算法(朴素、KMP、改进算法)

    本文根据<大话数据结构>一书,实现了Java版的串的朴素模式匹配算法.KMP模式匹配算法.KMP模式匹配算法的改进算法. 1.朴素的模式匹配算法 为主串和子串分别定义指针i,j. (1)当 ...

  5. 大话数据结构(8) 串的模式匹配算法(朴素、KMP、改进算法)

    --喜欢记得关注我哟[shoshana]-- 目录 1.朴素的模式匹配算法2.KMP模式匹配算法 2.1 KMP模式匹配算法的主体思路 2.2 next[]的定义与求解 2.3 KMP完整代码 2.4 ...

  6. 《数据结构》之串的模式匹配算法——KMP算法

    //串的模式匹配算法 //KMP算法,时间复杂度为O(n+m) #include <iostream> #include <string> #include <cstri ...

  7. 串的模式匹配算法 ------ KMP算法

    //KMP串的模式匹配算法 #include <stdio.h> #include <stdlib.h> #include <string.h> int* get_ ...

  8. 数据结构(三)串---KMP模式匹配算法

    (一)定义 由于BF模式匹配算法的低效(有太多不必要的回溯和匹配),于是某三个前辈发表了一个模式匹配算法,可以大大避免重复遍历的情况,称之为克努特-莫里斯-普拉特算法,简称KMP算法 (二)KMP算法 ...

  9. 串的模式匹配算法1 BF算法

    BF算法 字符串的模式匹配不一定要从主串的第一个位置开始,可以指定主串中查找的起始位置 pos. 2. 算法步骤: 1)分别利用计数器指针 i 和 j 指定主串和模式串即小字符串待比较的位置,初始化为 ...

随机推荐

  1. [拉格朗日反演][FFT][NTT][多项式大全]详解

    1.多项式的两种表示法 1.系数表示法 我们最常用的多项式表示法就是系数表示法,一个次数界为\(n\)的多项式\(S(x)\)可以用一个向量\(s=(s_0,s_1,s_2,\cdots,s_n-1) ...

  2. js数组长度

    js数组长度,一般使用length 属性即可获取,但这个数组是个对象则只能使用以下方式 var t=typeof o; var length=0; if(t=='string'){ length=o. ...

  3. 关于相对布局RelativeLayout的各种属性介绍

    RelativeLayout相对布局是个人觉得在android布局中比较常用且好用的一个,当然如果想让布局更漂亮是需要多种布局混合搭建的,这里就需要更深入的学习了,在这只介绍下有关相对布局的东西. 相 ...

  4. 「日常训练」 Soldier and Traveling (CFR304D2E)

    题意 (CodeForces 546E) 对一个无向图,给出图的情况与各个节点的人数/目标人数.每个节点的人只可以待在自己的城市或走到与他相邻的节点. 问最后是否有解,输出一可行解(我以为是必须和答案 ...

  5. 孤荷凌寒自学python第六十九天学习并实践beautifulsoup对象用法2

    孤荷凌寒自学python第六十九天学习并实践beautifulsoup对象用法2 (完整学习过程屏幕记录视频地址在文末) 今天继续学习beautifulsoup对象的属性与方法等内容. 一.今天进一步 ...

  6. KVM web管理工具——WebVirtMgr(一)

    WebVirtMgr 介绍     WebVirtMgr采用几乎纯Python开发,其前端是基于Python的Django,后端是基于Libvirt的Python接口,将日常kvm的管理操作变的更加的 ...

  7. 学习bash——管道命令

    摘要:管道命令概述.常见管道命令的使用(cut/grep.sort/wc/uniq.tee.tr/col/join/paste/expand.xargs.减号-) 一.概述 命令执行完会在屏幕上打印相 ...

  8. beta版本冲刺六

    目录 组员情况 组员2:胡青元 组员3:庄卉 组员4:家灿 组员5:恺琳 组员6:翟丹丹 组员7:何家伟 组员8:政演 组员9:黄鸿杰 组员10:刘一好 组员11:何宇恒 展示组内最新成果 团队签入记 ...

  9. 微信公众号开发java框架:wx4j(KefuUtils篇)

    wx4j-KefuUtils介绍 函数说明:添加客服 参数:Kefu对象 返回值:微信服务器响应的json字符串 public String addKefu(Kefu kefu) 函数说明: 参数:K ...

  10. Hadoop世界中的HelloWorld之WordCount具体分析

    MapReduce 应用举例:单词计数 WorldCount可以说是MapReduce中的helloworld了,下面来看看hadoop中的例子worldcount对其进行的处理过程,也能对mapre ...