什么是KMP

KMP俗称看毛片算法,是高效寻找匹配字串的一个算法

百度百科

KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。

总的来说这个东西是一个加速优化的算法,而且这三个大佬能发现这个算法实在是太强大了!!!

怎么实现KMP?

next数组的实现(失配数组)

具体高大上的来说就是什么字串的前缀和和后缀和相等的最大长度,实际上这个东西就是寻找如果匹配失效怎么高速寻找下一个位置的数组。具体来说就像是一个规律一样。

具体代码

  //我们规定next数组回溯如果为0,那么就是不存在。而且原字符串数组也是从第一位开始的,也就是说原字符串数组的位数跟数组的下标是一致的。
//所以说next数组回溯寻找的位置就是数组下标的位置
for(int i=2;i<=lb;i++)//i=1的时候默认回溯的就是0,所以从i=2开始寻找
{
while(j&&b[i]!=b[j+1])//j!=0的意思是j如果回溯到0的话不要让j再继续回溯,第二个条件就是自己匹配自己,这个地方是一个规律性的写法,可以自己手写模拟一下,十分的巧妙
j=next[j];//如果匹配失败,回溯到之前的位置继续匹配,而不是直接从0开始。这也是一个优化
if(b[i]==b[j+1])//如果匹配成功,j就加一继续继续寻找
j++;
next[i]=j;//每一次都得记录next数组的回溯位置
}

匹配的实现(应用next数组)

具体的代码

  j=0;//j从第0位开始
for(int i=1;i<=la;i++)//因为上面已经说过数组的字符位数就是字符串数组的第几位所以从1开始循环
{
while(j&&a[i]!=b[j+1])//如果失配回溯j,进行高效的寻找
j=next[j];
if(a[i]==b[j+1])//如果匹配成功就让j++
j++;
if(j==lb)//如果j等于原先字串的长度那么就算匹配成功
{
cout<<i-lb+1<<"\n";//别忘记i也在一直循环++
j=next[j];//回溯到之前的位置
}
}

完整代码(模板题 洛谷P3375 【模板】KMP字符串匹配)

#include <bits/stdc++.h>
using namespace std;
int next[1000010];
char a[1000010];
char b[1000010];
int main()
{
ios::sync_with_stdio(0);//关闭同步三步走
cin.tie(0);cout.tie(0);
cin>>a+1>>b+1;//从第一位输入
int la=strlen(a+1);//计算长度
int lb=strlen(b+1);
int j=0;//定义j
//我们规定next数组回溯如果为0,那么就是不存在。而且原字符串数组也是从第一位开始的,也就是说原字符串数组的位数跟数组的下标是一致的。
//所以说next数组回溯寻找的位置就是数组下标的位置
for(int i=2;i<=lb;i++)//i=1的时候默认回溯的就是0,所以从i=2开始寻找
{
while(j&&b[i]!=b[j+1])//j!=0的意思是j如果回溯到0的话不要让j再继续回溯,第二个条件就是自己匹配自己,这个地方是一个规律性的写法,可以自己手写模拟一下,十分的巧妙
j=next[j];//如果匹配失败,回溯到之前的位置继续匹配,而不是直接从0开始。这也是一个优化
if(b[i]==b[j+1])//如果匹配成功,j就加一继续继续寻找
j++;
next[i]=j;//每一次都得记录next数组的回溯位置
}
j=0;//j从第0位开始
for(int i=1;i<=la;i++)//因为上面已经说过数组的字符位数就是字符串数组的第几位所以从1开始循环
{
while(j&&a[i]!=b[j+1])//如果失配回溯j,进行高效的寻找
j=next[j];
if(a[i]==b[j+1])//如果匹配成功就让j++
j++;
if(j==lb)//如果j等于原先字串的长度那么就算匹配成功
{
cout<<i-lb+1<<"\n";//别忘记i也在一直循环++
j=next[j];//回溯到之前的位置
}
}
for(int i=1;i<=lb;i++)//这里是输出next数组的
cout<<next[i]<<" ";
return 0;//结束
}

总结

对于朴素的BF算法来说,从时间复杂度O(mn)降低到了O(m+n),之后还KMP的拓展算法,等以后在补坑了例如sunday算法,不过对于能发现这个算法的人来说,实在是太强大了

KMP瞎扯一下的更多相关文章

  1. 瞎扯KMP

    瞎扯\(KMP\) 众所周知,\(KMP\)是一种玄学的字符串模式匹配算法. 什么是字符串模式匹配? 通俗的讲,就是统计一个字符串(通常很长)中某个子串(即一段连续的字符)出现的次数或位置.一般来说, ...

  2. KMP算法求解

    // KMP.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include<iostream> using namespac ...

  3. 简单有效的kmp算法

    以前看过kmp算法,当时接触后总感觉好深奥啊,抱着数据结构的数啃了一中午,最终才大致看懂,后来提起kmp也只剩下“奥,它是做模式匹配的”这点干货.最近有空,翻出来算法导论看看,原来就是这么简单(先不说 ...

  4. KMP算法

    KMP算法是字符串模式匹配当中最经典的算法,原来大二学数据结构的有讲,但是当时只是记住了原理,但不知道代码实现,今天终于是完成了KMP的代码实现.原理KMP的原理其实很简单,给定一个字符串和一个模式串 ...

  5. 萌新笔记——用KMP算法与Trie字典树实现屏蔽敏感词(UTF-8编码)

    前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"* ...

  6. [KMP]【学习笔记】

    Oulipo Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 36916   Accepted: 14904 Descript ...

  7. KMP算法实现

    链接:http://blog.csdn.net/joylnwang/article/details/6778316 KMP算法是一种很经典的字符串匹配算法,链接中的讲解已经是很明确得了,自己按照其讲解 ...

  8. KMP专题

    1.[HDU 3336]Count the string(KMP+dp) 题意:求给定字符串含前缀的数量,如输入字符串abab,前缀是a.ab.aba.abab,在原字符串中出现的次数分别是2.2.1 ...

  9. KMP学习之旅

    说起kmp就要从字符串的匹配说起,下面我们谈谈字符串的匹配 给定一个原字符串:bababababababababb,再给定一个模式串:bababb,求模式串是否在源字符串中出现 最简单的方法就是遍历源 ...

随机推荐

  1. projecteuler----&gt;problem=12----Highly divisible triangular number

    title: The sequence of triangle numbers is generated by adding the natural numbers. So the 7th trian ...

  2. 转 Dos和linux格式转换(转)

    错误提示: bad interpreter: No such file or directory: /bin/sh 错误分析: 因为操作系统是windows,在windows下编辑的脚本,所以有可能有 ...

  3. HTML5中File

    一 File对象与FileList对象 当将input元素的type类型设置为file时,web页面上会显示一个选择文本按钮和一个文本显示框,单击文件按钮可以选择一个文件,文本显示框中会显示选中的文件 ...

  4. bzoj 1668: [Usaco2006 Oct]Cow Pie Treasures 馅饼里的财富【记忆化搜索+剪枝】

    c[x][y]为从(x,y)到(n,m)的最大值,记忆化一下 有个剪枝是因为y只能+1所以当n-x>m-y时就算x也一直+1也是走不到(n,m)的,直接返回0即可 #include<ios ...

  5. golang——log包学习

    log包实现了简单的日志服务. 1.func New(out io.Writer, prefix string, flag int) *Logger New创建一个Logger. 参数out设置日志信 ...

  6. Sql 主键设置

    1.开发数据库时常用命名规范 1>.使用不包含数字的单数表名,如果必要的话可以增加模块名前缀. 2>.对于主键的命名,使用表名+ID的形式. 3>.作为外键的列的名字应该与它们所对应 ...

  7. NetCore Netty 框架 BT.Netty.RPC 系列随讲 —(前序) REST API 与 RPC 经典网络基础服务架构

    在服务体系架构内,我们所知道的,有两种请求模型: Http 请求模型,以及 RPC 请求模型.因此,在一个互联网请求模型架构上,都是这两种的请求模型的向互组合. 下面给出两种常见的互联网经典基础架构图 ...

  8. 递推DP UVA 1424 Salesmen

    题目传送门 /* 题意:给定包含n个点的无向图和一个长度为L的序列,修改尽量少的点使得相邻的数字相同或连通 DP:状态转移方程:dp[i][j] = min (dp[i][j], dp[i-1][k] ...

  9. DFS POJ 3087 Shuffle'm Up

    题目传送门 /* 题意:两块扑克牌按照顺序叠起来后,把下半部分给第一块,上半部给第二块,一直持续下去,直到叠成指定的样子 DFS:直接模拟搜索,用map记录该字符串是否被搜过.读懂题目是关键. */ ...

  10. 树形DP URAL 1039 Anniversary Party

    题目传送门 /* 题意:上司在,员工不在,反之不一定.每一个人有一个权值,问权值和最大多少. 树形DP:把上司和员工的关系看成根节点和子节点的关系,两者有状态转移方程: dp[rt][0] += ma ...