讲KMP算法，离不开BF，实际上，KMP就是BF升级版，主要流程和BF一样

不同是在匹配失败时能利用子串的特征减少回溯，利用根据子串特征生成的Next数组来减少

<(￣︶￣)↗[GO!]

！！！所有数组下标都是从0开始

1. 先看看BF算法（暴力破解）

int Brute_force_1(const char *S, const char *T)

{

	if (!S || !T)

		return -1;

	int lenS = strlen(S);

	int lenT = strlen(T);

	int i = 0;				//主串下标索引

	int j = 0;				//子串下标索引

	while(i < lenS && j < lenT)

	{

		if (S[i] == T[j])	//如果相等一直继续往下匹配

            ++i,++j;

		else				//不相等i和j开始回溯

		{

			i = i-j+1;

			j = 0;

		}

	}

	if (j == lenT)

		return i - j;

	return -1;

}

BF算法有几种不同实现，但最终思想都是一样的，以下就是另一个BF实现

int Brute_force_2(const char *S, const char *T)

{

	if (!S || !T)

		return -1;

	int lenS = strlen(S);

	int lenT = strlen(T);

	for (int i = 0; i <= lenS - lenT; ++i)

	{

		int k = i, j = 0;

		while (k < lenS && j < lenT && S[k] == T[j])

		{

			++j;

			++k;

		}

		if (j == lenT)

			return i; //说明匹配到了

	}

	return -1;

}

你完全可以根据自己的理解写出BF算法，但在这里，为了BF和KMP统一，我们还是采用第一种实现，即容易看出回溯操作的实现

2. Next[]数组

事实上，书上的next数组生成算法是经过优化后的算法，比较难懂，但你完全可以按照自己的理解做一个

注意：Next[]数组只是在KMP中字符串匹配失败时使用的

void GetNext(int Next[], char *str)

{

	assert(str!=NULL);

	int len = strlen(str);

	if(len>1)Next[0]=0;

//其实Next[0]等于0或者等于-1效果没什么影响，

//因为在KMP中不匹配时判断是不是第一个字符不匹配用用的是j==0；-----if (j==0||Next[j]==0)，

	if(len>2)Next[1]=0;

//Next[]等于0时说明需要讲i回溯到子串头的下一个位置（i=i-j+1）；

//此时j也回到子串头位置（j=0）

	for(int i=2;i<len;++i)

	{

		for(int j=i-1;j>0;--j)

		{

			if(!strncmp(&str[0],&str[i-j],j))

			{

				Next[i]=j;break;		//找到最大重复子子串（子串中的子串）

//Next[]为其他值则i不变，讲j回溯到Next[j]的位置(j=Next[j])

			}

			else Next[i]=0;

		}

	}

}

这个时间复杂度要比书上的方法高很多，但好理解，真实的反映了Next数组的本质。

3. KMP

int KMP(const char *S, const char *T, const int *Next)

{

	if (!S || !T||!Next)

		return -1;

    int lenS = strlen(S);

	int lenT = strlen(T);

	int i = 0;				//主串下标索引

	int j = 0;				//子串下标索引

	while(i < lenS && j < lenT)

	{

		if (S[i] == T[j]) ++i,++j;	//若相等则继续匹配下一个字符

		else		//不相等则回溯

		{

            //（当j==0时，即第一个字符不匹配，和Next[j]==0时事实上与BF算法相同）

			if (j==0||Next[j]==0)

            {

				i = i-j+1;

				j = 0;

			}

			else j = Next[j];//主串i位置不变，讲子串下标索引挪到Next[j]的位置

		}

	}

	if (j == lenT)

		return i - j;

	return -1;

}

这个回溯时的操作实际上是把两种情况合成一种，拆开后就是下面的，就是生成next数组那块三种情况

while (i < lenS && j < lenT)

{

	if (S[i] == T[j])

		++i, ++j;

	else

	{

		if (j == 0)

		{

			++i; //等价于i = i-0+1;j本身就等于0

		}

		else if (Next[j] == 0)

		{

			i = i - j + 1;

			j = 0;

		}

		else

		{

			j = Next[j];

		}

	}

}

扩展

Next数组有进一步改进的可能，如果发生失配，失配点子串字符若与回溯到的字符相同，则再次匹配肯定失败，所以改进的Next数组进一步处理了这种情况，消除了回溯

void GetNext_pro(int Next[], const char *str)

{

	assert(str!=NULL);

	int len = strlen(str);

	if(len>1)Next[0]=-1;

//其实Next[0]等于0或者等于-1效果没什么影响，

//因为在KMP中不匹配时判断是不是第一个字符不匹配用用的是j==0；-----if (j==0||Next[j]==0)，

	if(len>2)Next[1]=0;

//Next[]等于0时说明需要讲i回溯到子串头的下一个位置（i=i-j+1）；

//此时j也回到子串头位置（j=0）

	for(int i=2;i<len;++i)

	{

		for(int j=i-1;j>0;--j)

		{

			if(!strncmp(&str[0],&str[i-j],j))

			{

				if(str[i]==str[j])

					Next[i]==Next[j];

				else

					Next[i]=j;

				break;		//找到最大重复子子串（子串中的子串）

//Next[]为其他值则i不变，讲j回溯到Next[j]的位置(j=Next[j])

			}

			else Next[i]=0;

		}

	}

}

测试代码

int KMP(const char *S, const char *T)

{

	if (!S || !T)

		return -1;

	int Next[MAXSIZE] = {0};

	GetNext(Next,T);

	print_arr(Next, strlen(T));

	GetNext_pro(Next,T);

	print_arr(Next, strlen(T));

    int lenS = strlen(S);

	int lenT = strlen(T);

	int i = 0;				//主串下标索引

	int j = 0;				//子串下标索引

	while(i < lenS && j < lenT)

	{

		if (S[i] == T[j])

			++i,++j;	//若相等则继续匹配下一个字符

		else		//不相等则回溯

		{

            //（当j==0时，即第一个字符不匹配，和Next[j]==0时事实上与BF算法相同）

			if (j==0||Next[j]==0)

            {

				i = i-j+1;

				j = 0;

			}

			else j = Next[j];//主串i位置不变，将子串下标索引挪到Next[j]的位置

		}

	}

	if (j == lenT)

		return i - j;

	return -1;

}

int main(void)

{

	char source[MAXSIZE] = "adcfabadcf";

	char target[MAXSIZE] = "abcabcabbac";

	printf("%d\n", Brute_force_1(source, target));

	printf("%d\n", Brute_force_2(source, target));

	printf("%d\n", KMP(source, target));

	getchar();

	return 0;

}

附上BF与KMP的比较，你会发现两者其实挺相似

总结

其实核心就在于本文第一句话的理解。

KMP在子串含有相同前后缀时，利用Next数组减少匹配失败时的回溯次数有优势，而改进的Next数组在此基础上若子串含有较多相同字符则更进一步减少回溯。

所以KMP总之是利用子串的特征来削除回溯，如果子串并不具有这些特征，那就还没有BF好，因为KMP还需要额外的空间来存放Next数组

书上的next数组的生成很难懂，加油理解中。。。(ง •_•)ง

KMP 算法简单解释的更多相关文章

KMP算法具体解释（贴链接）
---------------------------------------------------------------------------------------------------- ...
KMP算法具体解释(转)
作者:July. 出处:http://blog.csdn.net/v_JULY_v/. 引记此前一天,一位MS的朋友邀我一起去与他讨论高速排序,红黑树,字典树,B树.后缀树,包含KMP算法,只有在解 ...
KMP算法简单回顾
前言虽从事企业应用的设计与开发,闲暇之时,还是偶尔涉猎数学和算法的东西,本篇根据个人角度来写一点关于KMP串匹配的东西,一方面向伟人致敬,另一方面也是练练手,头脑风暴.我在自娱自乐,路过的朋友别太认 ...
KMP算法具体解释
这几天学习kmp算法,解决字符串的匹配问题.開始的时候都是用到BF算法,(BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配 ...
串的应用与kmp算法讲解--学习笔记
串的应用与kmp算法讲解 1. 写作目的平时学习总结的学习笔记,方便自己理解加深印象.同时希望可以帮到正在学习这方面知识的同学,可以相互学习.新手上路请多关照,如果问题还请不吝赐教. 2. 串的逻辑 ...
字符串匹配KMP算法的C语言实现
字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD" ...
字符串匹配（KMP 算法含代码）
主要是针对字符串的匹配算法进行解说有关字符串的基本知识传统的串匹配法模式匹配的一种改进算法KMP算法网上一比較易懂的解说小样例 1计算next 2计算nextval 代码有关字符串的基本知 ...
(收藏)KMP算法的前缀next数组最通俗的解释
我们在一个母字符串中查找一个子字符串有很多方法.KMP是一种最常见的改进算法,它可以在匹配过程中失配的情况下,有效地多往后面跳几个字符,加快匹配速度. 当然我们可以看到这个算法针对的是子串有对称属性, ...
KMP算法的next[]数组通俗解释
原文:https://blog.csdn.net/yearn520/article/details/6729426 我们在一个母字符串中查找一个子字符串有很多方法.KMP是一种最常见的改进算法,它可以 ...

随机推荐

用 20 行 python 代码实现人脸识别！
点击上方"Python编程与实战",选择"置顶公众号" 第一时间获取 Python 技术干货! 阅读文本大概需要 11分钟. 今天给大家介绍一个世界上最简洁的人 ...
微软亚洲研究院开源图数据库GraphView
我们很高兴地宣布,由微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源.GraphView是一款中间件软件,方便用户使用关系数据库SQL Server 或Azure SQ ...
Picaso完美兼容OkHttp3.3，缓存优化两不误 - Tamic Developer"s Blog
为何在Fresco,Glide这么强大的背景下,我又想起了当初的Picasso,又为何写这篇文章?是因为最近项目采用了square公司的RxAndroid,Retrfit和OKhttp, 不得不联想到 ...
通俗易懂DenseNet
目录写在前面 Dense Block与Transition Layer DenseNet网络架构与性能理解DenseNet Plain Net.ResNet与DenseNet 参考博客:博客园 ...
简单说用CSS做一个魔方旋转的效果
说明魔方大家应该是不会陌生的,这次我们来一起用CSS实现一个魔方旋转的特效,先来看看效果图! 解释我们要做这样的效果,重点在于怎么把6张图片,摆放成魔方的样子,而把它们摆放成魔方的样子,重点在于用 ...
javascript中你可能遇到的隐式调用
前言不知道用隐式调用来形容是否确切,其行为总是隐藏在背后,时不时出来露脸一下,作用貌似不大,但是了解一下还是有用处的,保不准在你的使用下大有作为.所谓的隐式调用简单来说就是自动调用一些方法,而这些方 ...
对于页面适配，你应该使用px还是rem
css中的单位很多,%.px.em.rem,以及比较新的vw.vh等.每个单位都有特定的用途,比如当需要设置一个矩形的宽高比为16:9,并且随屏幕宽度自适应时,除了用%,其他单位是很难做到的.所以不存 ...
SIP 协议详解
SIP 协议详解 2013年参与过一个"视频通讯的App"项目,使用Sip协议通信.当时通信协议这块不是自己负责,加上时间紧.任务重等方面的原因,一直未对Sip协议进行过深入的了解 ...
MongoDB Compass最新版（v_1.20.5）远程连接数据库
最近下载了最新版本的MongoDB Compass(v_1.20.5)后才发现软件较之前的版本有了很大的变化,主要体现在创建连接页面和连接方式上. 这是旧版的连接页面,所有的参数项以表单的形式列出,直 ...
阿里云上docker部署nginx实现反向代理
简介需要从镜像仓库找到所需要的nginx版本pull下来.(地址:https://hub.docker.com/) 1.docker pull nginx 1.挂载目录 1.1 获取nginx. ...

KMP 算法简单解释

1. 先看看BF算法（暴力破解）

2. Next[]数组

3. KMP

扩展

总结

KMP 算法简单解释的更多相关文章

随机推荐

热门专题