字符串匹配(KMP算法)
KMP算法,是由Knuth,Morris,Pratt共同提出的模式匹配算法,其对于任何模式和目标序列,都可以在线性时间内完成匹配查找,而不会发生退化,是一个非常优秀的模式匹配算法。
举个例子来说,如果我想在字符串s(BBCABCEFABCDACEABCDACD)找是否存在子串t(ABCDABD)。
1.
我们先去找匹配第一个字符,发现字符串s第一个字符与字符串t的第一个字符不匹配,然后我们继续往后找。
2.
直到搜到s的第4个字符才找到和t的第一个字符匹配的字符。
3.
然后我们继续一位位搜。
4.
直到我们搜到不能匹配的位置。
5.
正常想法是直接移一位,然后再从头开始逐个比较。这样做虽然可行,但效率太低。而这个就是KMP与众不同的地方。
当E和B不匹配的时候,你已经匹配了前5个,也就是说你知道t串前面6个的信息,KMP正是利用了这个已知信息,不把搜索位置移回已经比较过的位置,继续把它向后移,这样就提高了效率。
6.
那么怎样往后移呢?,我们可以针对t建一张部分匹配表,那么这张表如何产生的呢?
"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例,
(以上两图均出自参考文献)
附上伪代码:
nt[] = ;
int n = strlen(s);
for(int i = , j = ; i < n; i ++){
while(j != && s[j] != s[i]) j = nt[j - ];
nt[i] = s[j] == s[i] ? ++ j : ;
}
7.
然后,我们继续来看,我们发现最后一个匹配的字母为A,部分匹配值为1,根据移动公式:
移动位数 = 已匹配的字符数 - 对应的部分匹配值
5 - 1 = 4,所以向后移4位,变成上图。然后我们发现B和E仍旧不能匹配,此时算出需要移动位数为1,然后便有了下图。
之后我们发现A和E不能匹配,然后我们继续一位一位移,知道再找到一个A。
8.
然后我们又搜到了A,然后我们可以继续匹配啦。
9.
知道搜到最后一位(啊呀就差一点就能完全匹配,可惜),然后我们发现要移动4位。
10.
然后我们继续匹配,发现到最后刚好匹配完(好开心,找到了!)如下图:
附上总代码:
#include <cstdio>
#include <cstring>
const int N = + ;
char s[N];
int nt[N];
char t[N]; void work(){
nt[] = ;
int n = strlen(s);
for(int i = , j = ; i < n; i ++){
while(j != && s[j] != s[i]) j = nt[j - ];
nt[i] = s[j] == s[i] ? ++ j : ;
//printf("nt[%d] = %d\n", i, nt[i]);
}
int p = ;
int q = ;
int lt = strlen(t);
int ans = ;
while(p + q < lt){
if(s[p] == t[p + q]){
while(s[p] == t[p + q] && p < n) p += ;
//printf("p = %d\n", p);
if(p == n)ans += ;
int w = p - nt[p - ];
p = nt[p - ];
q += w;
}
else {
while(p != && s[p] != t[p + q]) p = nt[p - ];
q += ;
}
}
printf("%d\n", ans);
} int main() {
//while(scanf("%s%s", s, t) == 2) work();
int T;
scanf("%d", &T);
while(T--){
scanf("%s%s", s, t);
work();
}
return ;
}
参考文献:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html
字符串匹配(KMP算法)的更多相关文章
- 字符串匹配KMP算法详解
1. 引言 以前看过很多次KMP算法,一直觉得很有用,但都没有搞明白,一方面是网上很少有比较详细的通俗易懂的讲解,另一方面也怪自己没有沉下心来研究.最近在leetcode上又遇见字符串匹配的题目,以此 ...
- 字符串匹配KMP算法
1. 字符串匹配的KMP算法 2. KMP算法详解 3. 从头到尾彻底理解KMP
- 字符串匹配--kmp算法原理整理
kmp算法原理:求出P0···Pi的最大相同前后缀长度k: 字符串匹配是计算机的基本任务之一.举例,字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符 ...
- 字符串匹配KMP算法的C语言实现
字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD" ...
- 字符串匹配KMP算法的讲解C++
转自http://blog.csdn.net/starstar1992/article/details/54913261 也可以参考http://blog.csdn.net/liu940204/art ...
- 字符串匹配KMP算法(转自阮一峰)
转自 http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 字符串匹配是计算 ...
- 【Luogu P3375】字符串匹配KMP算法模板
Luogu P3375 模式串:即题目中的S2所代表的意义 文本串:即题目中的S1所代表的意义 对于字符串匹配,有一种很显然的朴素算法:在S1中枚举起点一位一位匹配,失配之后起点往后移动一位,从头开始 ...
- 字符串匹配——KMP算法
关于KMP算法的分析,我觉得这两篇博客写的不错: http://www.ruanyifeng.com/blog/2013/05/Knuth–Morris–Pratt_algorithm.html ht ...
- 字符串匹配—KMP算法
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特-莫里斯-普拉特操作(简称KMP算法).KMP算法的核心是利用匹配失败后 ...
- <字符串匹配>KMP算法为何比暴力求解的时间复杂度更低?
str表示文本串,m表示模式串; str[i+j] 和 m[j] 是正在进行匹配的字符; KMP的时间复杂度是O(m+n) , 暴力求解的时间复杂度是O(m*n) KMP利用了B[0:j]和A[i ...
随机推荐
- XML学习总结(一)——XML介绍
一.XML概念 Extensible Markup Language,翻译过来为可扩展标记语言.Xml技术是w3c组织发布的,目前推荐遵循的是W3C组织于2000发布的XML1.0规范. 二.学习XM ...
- 【同步复制常见错误处理3】找不到存储的过程 sp_MSins_tablename
环境在SQL2008 R2同步复制时出错 这个错误提示是由于在订阅端没有找到同步时调用的同步存储过程,MS错误说明: 当某个事务发布在 SQL SERVER自动同步设置选择订阅服务器插入. 更新和删除 ...
- Python Tomcat Script(多实例)
之前书写过 Tomcat 单实例的 Python 脚本,本次增加 Tomcat 多实例的操作脚本. 1:准备 安装所需 Python 插件 A方法: pip install argparse B方法: ...
- java 根据 根节点及所有子成员 构造树tree
实体类entity package com.ompa.biz.entity; import java.util.ArrayList; import java.util.List; public cla ...
- ubuntu16.04下安装openssh-server报依赖错误的解决方法
问题:系统重装后,安装和配置SSH,防火墙配置 #安装install openssh-server sudo apt install openssh-server -y 遇到问题: sudo apt ...
- OO的设计原则
今天同事和我们一起讨论分享了OO的设计原则,讨论使人明晰,有人一起讨论学习是一件幸福的事情. 1.开闭原则 对功能的扩展是开放的,对修改是闭合的. 可以应用于类的设计,框架的设计等. 为什么?开闭原则 ...
- shell script 学习笔记-----标准输出
1.将标准输出(stdout)和标准错误输出(stderr)分别重定向到两个不同的文件 其中符号'>'默认将标准输出重定向,意思和'1>'相同,‘2>'表示重定向标准错误输出,数字1 ...
- HTML5性能优化
HTML5性能优化 在看完这两章内容之后,我意犹未尽,于是乎从网上搜索关键字“Java Web高性能”,在IBM社区找到两篇不错的文章,而让人更意外的是我发现那两篇文章的内容跟<高性能HTML5 ...
- codeforces 721B B. Passwords(贪心)
题目链接: B. Passwords time limit per test 2 seconds memory limit per test 256 megabytes input standard ...
- NYOJ-93汉诺塔(三)
汉诺塔(三) 时间限制:3000 ms | 内存限制:65535 KB 难度:3 描述 在印度,有这么一个古老的传说:在世界中心贝拿勒斯(在印度北部)的圣庙里,一块黄铜板上插着三根宝石针.印度 ...