KMP算法 字符串匹配(看猫片)
前言
此篇笔记根据自己的理解和练习心得来解释算法,只代表个人观点,如有不足请指出(我刚学QWQ)
浅谈字符串匹配
设想一个场景,假设你是一个净化网络语言环境的管理员,每天需要翻阅大量的文章和帖子来查找敏感字,那么这个时候很简单的可以想到可以运用字符串匹配来做到,但是朴素的单模式字符串匹配耗用时间多,那么在这里我们就可以运用高效率的\(KMP\)算法来解决。
算法对比
- 朴素单模式字符串匹配算法
朴素的单模式串匹配大概就是枚举每一个文本串元素,然后从这一位开始不断向后比较,每次比较失败之后都要从头开始重新比对
给定一个文本串(要查找符合条件的字符串),以及一个模式串(需要匹配的字符串)
模式串:abcab
文本串:abcacababcab
一般的思想就是,当我们在第五位失配时,我们会从当前模式串的第一位所处在文本串的位置的后一位开始与模式串的第一位进行匹配,直到匹配成功位置,就会出现以下的情况
模式串: abcab
文本串:abcacababcab
这一种算法的正确性是100%的,但是复杂度显然不是那么喜人,一般来说,期望时间复杂度可以为\(O(n+m)\)的,但是一些有心的出题人甚至可以卡到\(O(nm)\),所以这个算法仅仅用于暴力打法即可。
- \(KMP\)字符匹配算法
对于失配以后的字符串,不需要去从头开始枚举浪费时间,而是根据预先处理好的值来进行枚举即可,也就是寻找最优历史处理,
根据处理的过程,时间复杂度为\(O(n+m)\)
依旧是给定一个样例来说明
模式串:abcabc
文本串:abcabdababcabc
在这个样例中我们可以看到,在第六位的时候失配了,这个时候有一个\(KMP\)算法的专门小\(trick\),我们观察字符串可以发现的是,在模式串中,失配的前一位第五位在这整个模式串中可以找到一个和他相匹配的字符,也就是第二位的\(b\),那么我们现在就可以把模式串的匹配长度跳转到\(2\)继续查找,那么为什么可以这样做呢,因为我们可以发现,在匹配的时候,第五位的\(b\)之所以可以转移到第二位,靠的就是以第五位结尾的一个子串,可以与从\(1-2\)这个范围内的子串一一对应起来,也就是完全的按位匹配。
那么转移过来就是这样的
模式串: abcabc
文本串:abcabdababcabc
通过这个方法我们可以节省一大堆无用的时间。
思路分析
首先设置\(kmp\)数组为失配数组,也就是存储当匹配失败后跳转到接下来模式串匹配的最优的位置,因为相比较于文本串,模式串更加的灵活多变,处理起来也很方便,那么处理失配数组的时候将模式串当做处理串。
那么核心就在于如何来处理失配数组的值
我们要明确的是,在上面条件的基础上,我们要考虑的是当模式串的第\(i\)为失配以后,如何来调到最优的位置继续进行匹配,因为在文本串当中\(i\)以前的位置都已经失效了,那么我们对于每一个\(kmp_i\)要记录的是:
在模式串\(str\)中,我们可以找到一个最优的位置\(j\),满足\(i\geq j\)并且满足\(str_i=str_j\),并且在\(j!=1\)的时候,有从\(str_1-str_{j-1}\)分别与\(str_{i-j+1}-str_{j-1}\)按位匹配。
简单来说就是在模式串中,存在一个长度为\(len\)的以\(1\)开头以\(j\)结尾的子串与以\(i-j+1\)开头以\(i\)结尾的子串完全相同
代码实现
#include<iostream>
#include<cstring>
#include<stack>
#include<algorithm>
#include<cmath>
#include<cstdio>
#include<queue>
#include<map>
using namespace std;
const int N=1e6+9;
int kmp[N],j;
int lena,lenb;
char a[N],b[N];
int main()
{
cin>>a+1;
cin>>b+1;
lena=strlen(a+1);
lenb=strlen(b+1);
//预处理kmp数组
for(int i=2;i<=lenb;i++)//第一个字符一定是匹配的所以不需要i=1
{
while(b[i]!=b[j+1]&&j)//如果不匹配就往回跳
j=kmp[j];
if(b[i]==b[j+1])j++;//遇见相同的就向右移动
kmp[i]=j;
}
j=0;
for(int i=1;i<=lena;i++)
{
while(j&&b[j+1]!=a[i])
j=kmp[j];//通过自己匹配自己来求得每一个点的kmp值
if(b[j+1]==a[i])
j++;
if(j==lenb)
{
printf("%d\n",i-lenb+1);//这个是开始的值
j=kmp[j];
}
}
for(int i=1;i<=lenb;i++)
printf("%d ",kmp[i]);
return 0;
}
KMP算法 字符串匹配(看猫片)的更多相关文章
- KMP算法——字符串匹配
正直找工作面试巅峰时期,有幸在学校可以听到July的讲座,在时长将近三个小时的演讲中,发现对于找工作来说,算法数据结构可以算是程序员道路的一个考量吧,毕竟中国学计算机的人太多了,只能使用这些方法来淘汰 ...
- KMP算法---字符串匹配
算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...
- 字符串匹配的KMP算法-16张图片看明白
作者: 阮一峰 日期: 2013年5月 1日 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另 ...
- KMP算法——字符匹配
暴力匹配: 假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢? 如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置, ...
- 算法——字符串匹配之BM算法
前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...
- HDU 1711(KMP)字符串匹配
链接 HDU 1711 Number Sequence KMP 算法 我以自己理解写的,写的不对,不明白的地方海王子出来,一起共同学习: 字符串匹配 就是KMP,一般思想,用一个for循环找开头 ...
- KMP算法-字符匹配
字符匹配模式-KMP算法 j直接跳到了2的位置,因为在之前的都相同. 那么就需要求如果不等了之后,j需要回跳的位置next[j] 如果tk'与tj相等,则next [j+1]=k'+1 如果tk'与t ...
- KMP快速字符串匹配
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现.KMP算法的关键是利用匹配失败后的信息,从错误中吸取经验,尽量减少模式串与主串的匹配次数以 ...
- 算法——字符串匹配Rabin-Karp算法
前言 Rabin-Karp字符串匹配算法和前面介绍的<朴素字符串匹配算法>类似,也是相应每一个字符进行比較.不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进 ...
随机推荐
- springMVC生成pdf文件
pom.xml文件配置=== <!-- https://mvnrepository.com/artifact/com.itextpdf/itextpdf --> <dependenc ...
- 腾讯云联合多家生态伙伴,重磅开源 SuperEdge 边缘容器项目
在2020年12月19-20日腾讯 Techo Park 开发者大会上,腾讯云联合英特尔.VMware 威睿.虎牙.寒武纪.美团.首都在线,共同发布 SuperEdge 边缘容器开源项目. Super ...
- 服务器运行jupyter,本地浏览器打开
https://www.cnblogs.com/wwwhza/p/8821117.html https://blog.csdn.net/qq_29762941/article/details/8063 ...
- 【Azure Application Insights】在Azure Function中启用Application Insights后,如何配置不输出某些日志到AI 的Trace中
问题描述 基于.NET Core的Function App如果配置了Application Insights之后,每有一个函数被执行,则在Application Insights中的Logs中的tra ...
- java数组之基本语义
A[] a; B[] b=new B[5];print(b)print(b.length)a={new A(),new A()}//聚合初始化:隐式使用new在堆中创建A[] d=new A[];a= ...
- LeetCode 124 二叉树中最大路径和
题目: 给定一个非空二叉树,返回其最大路径和. 本题中,路径被定义为一条从树中任意节点出发,达到任意节点的序列.该路径至少包含一个节点,且不一定经过根节点. 思路:递归 分为三部分,根节点,左子树,右 ...
- 基于Python实现的系统SLA可用性统计
基于Python实现的系统SLA可用性统计 1. 介绍 SLA是Service Level Agreement的英文缩写,也叫服务质量协议.根据SRE Google运维解密一书中的定义: SLA是服务 ...
- 十六:SQL注入之查询方式及报错盲注
在很多注入时,有很多注入会出现无回显的情况,其中不回显的原因可能是SQL查询语句有问题,这时候我们需要用到相关的报错或者盲注进行后续操作,同时作为手工注入的时候,需要提前了解SQL语句能更好的选择对应 ...
- 一道有趣的golang排错题
很久没写博客了,不得不说go语言爱好者周刊是个宝贝,本来想随便看看打发时间的,没想到一下子给了我久违的灵感. go语言爱好者周刊78期出了一道非常有意思的题目. 我们来看看题目.先给出如下的代码: p ...
- 【ORA】ORA-27125:unable to create shared memory segment
在安装Oracle 10g的时候出现一个了错误,在网上总结了一下大牛写的文章 ORA-27125:unable to create shared memory segment 安装时出现这个错误安装会 ...