First.先上一份最原始的无任何优化的代码(暴力):

#include <iostream>
#include <cstring>
using namespace std;
char s[1000],p[1000]; inline int getans(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j])
i++,j++;
else{
i=i-j+1;
j=0;
}
}
if(j==pl) return i-j;
else return -1;
} int main(){
cin>>s>>p;
int ans=getans(s,p);
cout<<ans<<endl;
return 0;
}

对于文本串S和模拟串P,进行匹配。

i表示S串的位置,同理,j表示P串的位置;

若当前字符匹配,则进行下一个(i++,j++);

否则,将P归零,S回溯到上一次匹配的位置;

输出的是第一次匹配的位置。

Second.开始第一次优化(KMP):

在上述的暴力中,我们可以发现,每次失配时,i返回到了前面很远的地方,所以我们想搞这样一个东西;

它具备一个特殊性质:

在每次失配是,直接让P跳到这个位子上,大大减少复杂度。

在此,我们需要引入一个叫做next的数组;

但是,仍然有最坏的情况,就是需要重新匹配;

那么此时的next[i]=0或-1,表示重头在来;

若next[i]=k,则表示P跳过了k个字符。

简略代码:

inline int KMPsearch(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j]||j==-1)//j==-1表示匹配成功,进行后续的字符匹配
i++,j++;
else
j=nxt[j];//i不用变,j直接跳到预处理好的next[j]处
}
if(j==pl) return i-j;
else return -1;
}

1.

next数组记录的是长度最大且相等的前缀后缀;

举个例子:

P1:   ABA

P2:   ABAB

在P1中,他有长度为1的相同前缀后缀A

在P2中,他有长度为2的相同前缀后缀AB

(盗图勿喷)

2.

我们来求next数组;

将第一步中的长度稍作变形即可;

(同上)

整体右移一位,将第一位赋值为-1。

也可以这样理解:(与-1无关了就)

如果相等,则该位的next值就是前一位的next值加上1;

如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值即为1。

3.

代码求next数组;

inline void GetNext2(char *p,int nxt[]){
int pl=strlen(p);
nxt[0]=-1;
int k=-1;
int j=0;
while(j<pl-1){
if(k==-1 || p[j]==p[k]){
++j,++k;
if(p[j]!=p[k])
nxt[j]=k;
else nxt[j]=nxt[k];
}
else k=nxt[k];
}
}

Third.对于next数组的优化:

在上文所述中,有个小问题:

就是说,在j向后跳到了next[k]时,必然失配,

就是因为p[j]=p[next[j]];

那就要处理出所有这种情况,递归

next[j]=p[next[next[j]]]。

Finally.整体代码(可直接食用哦):

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std; char s[100],p[100];
int nxt[100]; inline void GetNext2(char *p,int nxt[]){
int pl=strlen(p);
nxt[0]=-1;
int k=-1;
int j=0;
while(j<pl-1){
if(k==-1 || p[j]==p[k]){
++j,++k;
if(p[j]!=p[k])
nxt[j]=k;
else nxt[j]=nxt[k];
}
else k=nxt[k];
}
} inline int KMPsearch(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j]||j==-1)
i++,j++;
else
j=nxt[j];
}
if(j==pl) return i-j;
else return -1;
} int main(){
cin>>s>>p;
GetNext2(p,nxt);
int ans=KMPsearch(s,p);
cout<<ans<<'\n';
return 0;
}

嗯,真香

KMP入门的更多相关文章

  1. zstu.4194: 字符串匹配(kmp入门题&& 心得)

    4194: 字符串匹配 Time Limit: 1 Sec  Memory Limit: 128 MB Submit: 206  Solved: 78 Description 给你两个字符串A,B,请 ...

  2. 题解报告:hdu 2087 剪花布条(KMP入门)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2087 Problem Description 一块花布条,里面有些图案,另有一块直接可用的小饰条,里面 ...

  3. hdu 1358 Period(KMP入门题)

    Period Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Subm ...

  4. KMP入门题目[不定期更新]

    HDU 1711 Number Sequence(模板题) #include <cstdio> ; ; int N, M; int textS[MAXN]; int tarS[MAXL]; ...

  5. KMP入门(匹配)

    Description Given two sequences of numbers : a[1], a[2], ...... , a[N], and b[1], b[2], ...... , b[M ...

  6. hdu 1358 period KMP入门

    Period 题意:一个长为N (2 <= N <= 1 000 000) 的字符串,问前缀串长度为k(k > 1)是否是一个周期串,即k = A...A;若是则按k从小到大的顺序输 ...

  7. hdu 1686 & poj 2406 & poj 2752 (KMP入门三弹连发)

    首先第一题 戳我穿越;http://acm.hdu.edu.cn/showproblem.php?pid=1686 题目大意好理解,每组输入一个子串和一个母串,问在母串中有多少个子串? 文明人不要暴力 ...

  8. HDU2203(KMP入门题)

    亲和串 Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...

  9. HDU2087(KMP入门题)

    剪花布条 Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submis ...

  10. HUD1686(KMP入门题)

    Oulipo Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Subm ...

随机推荐

  1. html页面引用video.js播放m3u8格式视频

    //head里面的内容,我是采用cdn引用的方式,因为项目太小 <head> <meta charset="utf-8" /> <title>二 ...

  2. java解决poi导出excel文字水印,导出excel不可操作问题

    首先需求是用户提出导出excel数据需使用水印备注其用途: 其实就是在导出excel的同时带有自定义文字水印的导出. 那么我们首先想到的肯定是以一个什么样的思路去解决该问题,首先查找poi导出exce ...

  3. redis基础知识详解

    一.redis基础知识 1.Redis是什么Redis是一个开源的key-value存储系统. 和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表 ...

  4. 2.keras-构建基本网络实现非线性回归

    构建基本网络实现非线性回归 1.加载显示数据集 import tensorflow as tf import numpy as np import keras from keras.layers im ...

  5. tensorflow2.0学习笔记第一章第三节

    1.3鸢尾花数据读入 # 从sklearn包datasets读入数据 from sklearn import datasets from pandas import DataFrame import ...

  6. Mysql(Mariadb)数据库主从

    Mysql主从复制的实现原理图大致如下: MySQL之间数据复制的基础是以二进制日志文件(binary log file)来实现的,一台MySQL数据库一旦启用二进制日志后,其作为master,它数据 ...

  7. Android学习笔记样式资源文件

    样式资源和主题资源都是写在styles.xml文件里面的 <style name="title"> <item name="android:textSi ...

  8. 一时技痒,撸了个动态线程池,源码放Github了

    阐述背景 线程池在日常工作中用的还挺多,当需要异步,批量处理一些任务的时候我们会定义一个线程池来处理. 在使用线程池的过程中有一些问题,下面简单介绍下之前遇到的一些问题. 场景一:实现一些批量处理数据 ...

  9. C++ 基于多态的职工管理系统

    职工管理系统 1.管理系统需求 职工管理系统可以用来管理公司内所有员工的信息 本教程主要利用C++来实现一个基于多态的职工管理系统 公司中职工分为三类:普通员工.经理.老板,显示信息时,需要显示职工编 ...

  10. -手写Spring注解版本&事务传播行为

    视频参考C:\Users\Administrator\Desktop\蚂蚁3期\[www.zxit8.com] 0018-(每特教育&每特学院&蚂蚁课堂)-3期-源码分析-手写Spri ...