【KMP原理】【整理回顾】
今儿套KMP模板做了个题,敏敏找我讲next[]数组的时候把我问懵了。具体原理都记不清了光靠模板凑得了一时凑不了一世啊,所以再捋一捋顺一顺,这次印象要深刻一点了;
KMP与暴力匹配的优化区别就不再提了,O(m+n)的复杂度已经完胜了,直接进入正题...
以下言论均是总结自该同学的,是不是原创我不清楚,链接反正是给你们吧...
匹配串S,模式串T;
首先是KMP的精华所在,next[]数组
next[i]=k的意思为:T[i]前面有k个字符和字符串T的前k个字符相同,且T[i]不等于开始的k个字符之后的第k+1个字符, 1<=k<j;
所以从另一种解题层面上讲,next[len]的值表示字符串str[0...len-1]的后缀等于str[0...len-1]前缀的最长长度,例题运用:hdu 4763;
举个例子:
0 1 2 3 4 5 6 7 8
S: a b c a b c a b d
T: a b c a b d a b a
1<=k<j, 因为T[0...1] = T[3...4],且T[2] != T[5],则next[5] = k = 2;
若T[2] == T[5]时,next[5] = 0; --> 为什么呢?
理解这个首先要明白利用next[i]我们可以做什么
根据next[5] = 2,有T[3] == T[0],T[4] == T[1],又因为S[4] == T[4],S[3] == T[3],所以S[3] == T[0],S[4] == T[1](两对相当于间接比较过了)。
接下来比较S[5]和T[2]是否相等,如果按问题的假设,T[2] == T[5],那么必然对于模式串T匹配到S[5]的位置仍是不匹配的;故此时的next[5]=0,模式串从T[0]与S[5]开始匹配;
有一个问题来了:S[3]和T[0],S[4]和T[1]是根据next[5]=2间接比较相等,那S[1]和T[0],S[2]和T[0]之间又是怎么跳过比较的呢?
我们一步步来,S[0]=T[0],S[1]=T[1],S[2]=T[2],
而T[0] != T[1], T[1] != T[2](这里只是针对具体例子,但只要next[i] = k,那么S[1]、S[2]和T[0]间总会间接比较的)
==> S[0] != S[1], S[1] != S[2],所以S[1] != T[0],S[2] != T[0]. 还是从理论上间接比较了。
下面重点来了,next[]怎样取值以及进行字符串匹配时next值又有什么存在意义呢?
next[]函数定义如下:
(1)next[0] = -1 意义:任何串的第一个字符的模式值规定为-1。
(2)next[j] = -1 意义:情况①->模式串T中下标为j的字符与首字符相同,且j的前面的1~k个字符与开头的1~k个字符不相等(1≤k<j).
情况②->下标为j的字符前面的1~k个字符与开头的1~k个字符相等但T[k]==T[j],(1≤k<j)。 如:T="abCabCad",T[0...2] == T[3...5]但T[3]=T[6],则next[6]=-1;
(3)next[j] = k 意义:模式串T中下标为j的字符,如果j前面的k个字符与开头的k个字符相等,且T[j] != T[k] (1≤k<j)。即T[0...k-1] == T[j-k ... j-1] 且T[j] != T[k];
(4)next[j] = 0 意义:除(1)(2)(3)的其他情况。
对于不理解的可以看一下我给的链接里文章的例子,我就不再粘过来了。
那么在进行字符串匹配时next值又该怎么使用呢?
1. next[i]= -1 表示S[cur]和T[0]间接比较过了,不相等,下一次比较 S[cur+1] 和T[0]
2. next[i]=0 表示比较过程中产生了不相等,下一次比较 S[m] 和T[0]。
3. next[i]= k > 0 但k < n, 表示,S[cur]的前k个字符与T中的开始k个字符已经间接比较相等了,下一次比较S[cur]和T[k]相等;
4. 其他值,不可能。
基本KMP的知识就是这样了,今天先暂时到这里,日后会继续补充;
【KMP原理】【整理回顾】的更多相关文章
- 字符串系列——KMP模板整理
KMP模板整理 KMP与扩展KMP: /*vs 2017/ vs code以外编译器,去掉windows.h头文件和system("pause");*/ #include<i ...
- 字符串匹配--kmp算法原理整理
kmp算法原理:求出P0···Pi的最大相同前后缀长度k: 字符串匹配是计算机的基本任务之一.举例,字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符 ...
- KMP原理、分析及C语言实现
(是在matrix67博客基础上整理而来,整理着:华科小涛@http://www.cnblogs.com/hust-ghtao/) 有些算法可以让人发疯,KMP算法就是一个.在网上找了很多资料讲的都让 ...
- [区块链|非对称加密] 对数字证书(CA认证)原理的回顾
摘要:文中首先解释了加密解密的一些基础知识和概念,然后通过一个加密通信过程的例子说明了加密算法的作用,以及数字证书的出现所起的作用.接着对数字证书做一个详细的解释,并讨论一下windows中数字证书的 ...
- 3星|《结构思考力》:用金字塔原理整理PPT的思路,案例偏简单
结构思考力 名义上全书是讲结构化思考,实际内容是用结构化思考的方法来整理PPT的思路,让PPT的逻辑更清晰.少部分提到如何修改标题更吸引人,如何做图表设计. 书中结构化思考的基本思路,重要的有两个:1 ...
- dynamic-load-apk插件原理整理
因为当前项目功能越来越多,编译速度越来越慢(公司电脑配置也挺差的...),并且方法数已超出65535的限制了,虽然通过multidex暂时解决了,但是这并不是一个好的解决方式.所以通过插件来加快编译速 ...
- KMP算法简单回顾
前言 虽从事企业应用的设计与开发,闲暇之时,还是偶尔涉猎数学和算法的东西,本篇根据个人角度来写一点关于KMP串匹配的东西,一方面向伟人致敬,另一方面也是练练手,头脑风暴.我在自娱自乐,路过的朋友别太认 ...
- Java的HashMap实现原理整理总结
通过Debug 探寻Java-HashMap 实现原理: 一个简单的例子,代码如下, 测试方法 main: public static void main(String[] args) { KeyOb ...
- HDOJ4763(KMP原理理解)
Theme Section Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Tot ...
随机推荐
- string insert 的性能分析
有这样一个网络传输包. 前端有个固定的包头,包含了后面传输body的长度信息. 在有拷贝的前提下,我们选用什么性能比较高呢? 方案一 复用data_buffer str ...
- [iOS UI进阶 - 3.2] 手势识别器UIGestureRecognizer
A.系统提供的手势识别器 1.敲击手势 UITapGestureRecognizer numberOfTapsRequired: 敲击次数 numberOfTouchesRequired: 同时敲 ...
- 关于cocoapods添加静态库的奇葩配置
不多说,直接上代码 当引入这个静态库时,一开始死活在编辑时找不到这个静态库. 直到看到这个贴子:http://stackoverflow.com/questions/19189463/cocoapod ...
- pygame简单动态图 & 动态图片的移动
之前在学pygame 时看了一些博客(来自http://eyehere.net/2011/python-pygame-novice-professional-plant-zombie-1/),觉得写得 ...
- PostgreSQL的 initdb 源代码分析之二十五
继续分析: make_postgres(); 展开: 目的是创建postgres数据库. cmd是:/home/pgsql/project/bin/postgres" --single -F ...
- const 成员方法
1.使用场景 代码提供者告诉客户(代码使用者),这个方法不会修改对象的内容,请客户放心使用. 2.代码提供者,尝试在const成员方法中修改对象内容,编译报错.在成员方法中,this是const 指针 ...
- Codeforces Testing Round #12 B. Restaurant 贪心
B. Restaurant Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/contest/597/problem ...
- Codeforces GYM 100114 C. Sequence 打表
C. Sequence Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/gym/100114 Description ...
- web.xml里<filter-mapping>中的<dispatcher>作用
2.4版本的servlet规范在部属描述符中新增加了一个<dispatcher>元素,这个元素有四个可能的值:即REQUEST,FORWARD,INCLUDE和ERROR,可以在一个< ...
- GDI+与图形编程研究
GDI+的基本概念 GDI+的常用对象,包括Graphics.Font.Brush.Pen等对象的创建和使用 常用图形的绘制 Color结构.Point结构和Rectangle结构 1.GDI+的概念 ...