KMP 理解
例题
以字符串 ABABACA 为例
a
前缀:
后缀:
结果为0
ab
前缀:a
后缀: b
结果为0
aba
前缀:a ab
后缀: ba a
结果为1,此时 i=2,j=1
abab
前缀:a ab aba
后缀: bab ab b
结果为2,此时 i=3,j=2
ababa
前缀:a ab aba abab
后缀: baba aba ba a
结果为3,此时 i=4,j=3
ababac
前缀:a ab aba abab ababac
后缀: babac abac bac ac c
结果为0,此时 i=5,j=3,1,0
ababaca
前缀:a ab aba abab ababac ababaca
后缀: babaca abaca baca bac ac c
结果为1,此时 i=6,j=0
next数组结果:
0 0 0 1 2 3 0 1
总结
以i为尾,往前数对应值,即是相等的,前提是相等的情况下(废话!);
前缀:要第一个字母,不要最后一个字母;
后缀:不要第一个字母,要最后一个字母;
至于i+1,因为计算的是前缀和后缀的重合的值的长度,所以还需要加上1;
最重要的是
j = next[i - 1],比如说现在在 i 位置上不匹配,为了避免重复匹配,不想浪费之前 0 到 i-1 的匹配长度,也就是说要找以 0 开头,i-1 结尾的匹配的子串,就是说找字符串上 i-1 位置的重合长度,因为next数组存储的是前缀和后缀的重合长度,所以还需要 i-1-1,也就是找next[i-1-1]的值,此时我们再比较字符串上 i 和 j 位置的字符是否相等;
如果相等 j 就尽管移动,代表重合的长度,也就是说到了该位置不匹配,只需要向前移动next数组中对应的长度。
贴上代码:
#include <iostream>
#include <string>
#include <vector>
using namespace std;
vector<int> getNext(string str) {
int len = str.size();
int j = 0;
vector<int>next(len + 1);
next[0] = next[1] = 0;
// j表明相同的个数
for (int i = 1; i < len; i++) {
while (j > 0 && str[i] != str[j]) {
j = next[j];
}
// 相同的个数
if (str[i] == str[j]) {
j++;
}
next[i+1] = j;
}
return next;
}
// 另一种写法
// vector<int> getNext2(string str) {
// int j = 0;
// int i = 1;
//
// vector<int> next(str.size());
// next[0] = 0; // 必须是0
//
// while (i < str.size()) {
// if (str[i] == str[j]) {
// j++;
// next[i] = j;
// i++;
// }
// else {
// if (j != 0) {
// j = next[j - 1];
// }
// else { // j 为 0
// next[i] = 0;
// i++;
// }
// }
// }
//
// return next;
//
// }
int search(string original, string find, vector<int> next) {
int i = 0, j = 0;
for (i = 0; i < original.length(); ++i) {
while (j > 0 && original[i] != find[j]) {
j = next[j];
}
if (original[i] == find[j])
++j;
if (j == find.size()) {
return i - j + 1;
}
}
return -1;
}
int main(int argc, const char * argv[]) {
string o = "ABABACAAC";
string f = "ABABACA";
vector<int> next = getNext(f);
// next
int i = 1;
while (i < next.size()) {
cout << "next " << next[i] << endl;
i++;
}
//search
int result = search(o, f, next);
cout << "result " << result << endl;
return 0;
}
KMP 理解的更多相关文章
- POJ3450【KMP理解】
题意: 求多个字符串的最长公共子串 思路: 4000个串,200长度. 一种暴力,对于一个串最多有200*200=40000级别个子串,然后我要再处理一下next数组200,8e6复杂度: 然后我要和 ...
- 【poj 3167】Cow Patterns(字符串--KMP匹配+数据结构--树状数组)
题意:给2个数字序列 a 和 b ,问按从小到达排序后,a中的哪些子串与b的名次匹配. a 的长度 N≤100,000,b的长度 M≤25,000,数字的大小 K≤25. 解法:[思考]1.X 暴力. ...
- KMP高质量代码实现详解
KMP算法 对于KMP算法我分为两个部分说明,第一部分是算法部分,介绍KMP算法的算法思想:第二部分是实现部分,介绍一种厉害的实现代码以及代码注释.当然了由于本文主要介绍怎么实现故而先分析实现,对KM ...
- BZOJ 3670 NOI2014 动物园 KMP+dp
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3670 题意概述:令num[i]表示字符串由1~i的字符形成的前缀中不相重叠的相同前后缀的数 ...
- 算法之美--3.2.3 KMP算法
不知道看了几遍的kmp,反正到现在都没有弄清楚next[j]的计算和kmp的代码实现,温故而知新,经常回来看看,相信慢慢的就回了 从头到尾彻底理解KMP 理解KMP /*! * \file KMP_算 ...
- 初涉KMP算法
久仰字符串系列理论 KMP 讲解(引用自bzoj3670动物园) 某天,园长给动物们讲解KMP算法. 园长:“对于一个字符串S,它的长度为L.我们可以在O(L)的时间内,求出一个名为next的数组.有 ...
- 【BZOJ】【1009】 【HNOI2008】GT考试
DP/KMP/矩阵乘法 好神的题啊……跪了跪了 $n\leq 10^9$是什么鬼……我们还是先不要考虑这个鬼畜的玩意了>_> 用类似数位DP的思路,我们可以想到一个DP方程:$f[i][j ...
- 从头到尾彻底理解KMP
从头到尾彻底理解KMP 作者:July 时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进. 1. 引言 本KMP原文最初写于2年多前的201 ...
- 深入理解kmp中的next数组
next数组 1. 如果对于值k,已有p0 p1, ..., pk-1 = pj-k pj-k+1, ..., pj-1,相当于next[j] = k. 此意味着什么呢?究其本质,next[j] = ...
随机推荐
- 关于mysql的wait_timeout参数 设置不生效的问题【转】
关于wait_timeout 有一次去online set wait_timeout 的时候发现改了不生效,如下: mysql> show variables like 'wait_timeou ...
- python实现单单链表
# -*- coding: utf-8 -*- # @Time : 2018/9/28 22:09 # @Author : cxa # @File : node.py # @Software: PyC ...
- 安装Visual Studio Scrum 1.0过程模板
近几年里,Scrum变成了相当流行的软件开发方法学.因为它轻量.可迭代且快速等优点,以致于在敏捷开发中极受欢迎.微软甚至将TFS2010自带的MSF Agile5.0过程模板做得像Scrum,开发者们 ...
- 005_MAC下的VMware fushion快捷键(折中)
由于MAC和VMware Fushion虚拟机之间有一些快捷键的映射,所以Windows虚拟机就找了一个折中的方案.现总结MAC下的win常用快捷键==> <1>最小化窗口(Alt ...
- 学习网站总结->
慕课大巴网:这是一个学习各类技术视频的网站 慕课大巴网点我-> 吾爱破解: 这是一个破解各类软件的网站 吾爱破解点我-> 鸠摩搜书:可以搜一些免费的书,我喜欢的都能搜到 鸠摩搜书点我-&g ...
- vue总结 03过滤器
过滤器 Vue.js 允许你自定义过滤器,可被用于一些常见的文本格式化.过滤器可以用在两个地方:双花括号插值和 v-bind 表达式 (后者从 2.1.0+ 开始支持).过滤器应该被添加在 JavaS ...
- Windows Phone 8 获取设备名称
通过使用Microsoft.Phone.Info.DeviceStatus类,我们可以获取设备的一些信息,如设备厂商,设备名称等.通过Microsoft.Phone.Info.DeviceStatus ...
- 洛谷P1491集合位置
传送门啦 这个题说白了就是求一个次短路. 方法是我们先跑一遍最短路,记录下最短路上每一个点的前驱.然后我们将最短路上每一条边都标记一次,分别跑一边最短路,求出最短路径即可. 在这我们不用特殊判断是否是 ...
- tp杂记
/** php中的大U函数三个参数: U('ajaxDelPic') ==> /index.php/Admin/Goods/ajaxDelPic.html U('ajaxDelPic?id=1' ...
- Linux学习笔记:pwd与dirs的区别
在Linux中可以使用pwd和dirs进行当前目录查看,分别用于显示当前目录和显示完整目录记录.具体如下: 1.pwd 显示当前目录 2.dirs 显示目录堆叠中的记录 END 2018-08-21 ...