理解KMP算法

母串：S[i]

模式串：T[i]

标记数组：Next[i](Next[i]表示T[0~i]最长前缀/后缀数)

先来讲一下最长前缀/后缀的概念

例如有字符串T[6]=abcabd接下来讨论的全部是真前缀/真后缀，也就是除去串自己本身之外的前缀/后缀

T[0]=a,此时前后缀都是a那么Next[0]=1

T[0~1]=ab,此时前缀为a，后缀为b两者不等因此Next[1]=0

T[0~2]=abc,此时前缀为a,ab，后缀为bc,c同上有Next[2]=0

T[0~3]=abca,此时前缀为a,ab,abc，后缀为bca,ca,a可以看到共同部分只有a因此Next[3]=1

T[0~4]=abcab,此时前缀为a,ab,abc,abca，后缀为bcab,cab,ab,b此时最长的公共部分为ab因此Next[4]=2

T[0~5]=abcabd,此时前缀为a,ab,abc,abca,abcab，后缀为bcabd,cabd,abd,bd,d无相等部分故Next[5]=0

说完前后缀的概念之后再来说说KMP的核心思想

例如S=abcabcabdabba,T=abcabd匹配时的情况如下

可以看到在S[5]的位置匹配失败，KMP的处理方式如下

说一下原因，在S[5]的位置匹配失败后直接用S[5]与T[2]去开始匹配，因为Next[5-1]也就是Next[4]=2,因此直接从T[2]重新开始匹配

原因很简单，既然Next[4]=2那么T[0~1]既可以与S[0~1]相等，也可以与S[3~4]相等，所以可以直接从T[2]开始，这也是KMP的精妙所在，不理解的可以自己写两个串试试。所以难点就在于Next数组的实现了，具体实现过程如下

这里只介绍了核心思想，原文比较详细请见：https://www.douban.com/note/321870890/

下面给出kuangbin大神的模板

#include<cstdio>

#include<iostream>

#include<algorithm>

#include<math.h>

#include<string.h>

#include<vector>

#include<queue>

#include<iterator>

#include<vector>

#include<set>

#define dinf 0x3f3f3f3f

typedef long long ll;

//const int Max=(1<<16)+10;

using namespace std;

#define SIZE 100000005

const int N = ;

int m_next[N];

char S[N],T[N];

int slen, tlen;

void getNext()

{

    int j, k;

    j = ; k = -; m_next[] = -;

    while(j < tlen)

        if(k == - || T[j] == T[k])

            m_next[++j] = ++k;

        else

            k = m_next[k];

}

/*

返回模式串T在主串S中首次出现的位置

返回的位置是从0开始的。

*/

int KMP_Index()

{

    int i = , j = ;

    getNext();

    while(i < slen && j < tlen)

    {

        if(j == - || S[i] == T[j])

        {

            i++; j++;

        }

        else

            j = m_next[j];

    }

    if(j == tlen)

        return i - tlen+;

    else

        return -;

}

/*

返回模式串在主串S中出现的次数

*/

int KMP_Count()

{

    int ans = ;

    int i, j = ;

    if(slen ==  && tlen == )

    {

        if(S[] == T[])

            return ;

        else

            return ;

    }

    getNext();

    for(i = ; i < slen; i++)

    {

        while(j >  && S[i] != T[j])

            j = m_next[j];

        if(S[i] == T[j])

            j++;

        if(j == tlen)

        {

            ans++;

            j = m_next[j];

        }

    }

    return ans;

}

int main()

{

    int TT;

    int i, cc;

    string str;

    cin>>TT;

    while(TT--)

    {

        getchar();

        scanf("%s %s",&T,&S);

        slen = strlen(S);

        tlen = strlen(T);

        cout<<"模式串T在主串S中首次出现的位置是: "<<KMP_Index()/+<<endl;

        cout<<"模式串T在主串S中出现的次数为: "<<KMP_Count()<<endl;

    }

    return ;

}

理解KMP算法的更多相关文章

理解 KMP 算法
KMP(The Knuth-Morris-Pratt Algorithm)算法用于字符串匹配,从字符串中找出给定的子字符串.但它并不是很好理解和掌握.而理解它概念中的部分匹配表,是理解 KMP 算法的 ...
深入理解KMP算法
前言:本人最近在看<大话数据结构>字符串模式匹配算法的内容,但是看得很迷糊,这本书中这块的内容感觉基本是严蔚敏<数据结构>的一个翻版,此书中给出的代码实现确实非常精炼,但是个人 ...
KMP算法详解 --- 彻头彻尾理解KMP算法
前言之前对kmp算法虽然了解它的原理,即求出P0···Pi的最大相同前后缀长度k. 但是问题在于如何求出这个最大前后缀长度呢? 我觉得网上很多帖子都说的不是很清楚,总感觉没有把那层纸戳破, 后来翻看 ...
从头到尾测地理解KMP算法【转】
本文转载自:http://blog.csdn.net/v_july_v/article/details/7041827 1. 引言本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP ...
深入理解KMP算法之续篇
前言: 纠结于KMP已经两天了,相较于本人之前博客中提到的几篇博文,本人感觉这篇文章更清楚地说明了KMP算法的来龙去脉. http://www.cnblogs.com/goagent/archive/ ...
真正理解KMP算法
作者:jostree 转载请注明出处 http://www.cnblogs.com/jostree/p/4403560.html 所谓KMP算法,就是判断一个模式串是否是一个字符串的子串,通常的算法当 ...
KMP算法 --- 深入理解next数组
在KMP算法中有个数组,叫做前缀数组,也有的叫next数组. 每一个子串有一个固定的next数组,它记录着字符串匹配过程中失配情况下可以向前多跳几个字符. 当然它描述的也是子串的对称程度,程度越高,值 ...
从有限状态机的角度去理解Knuth-Morris-Pratt Algorithm(又叫KMP算法)
转载请加上:http://www.cnblogs.com/courtier/p/4273193.html 在开始讲这个文章前的唠叨话: 1:首先,在阅读此篇文章之前,你至少要了解过,什么是有限状态机, ...
KMP算法的一次理解
1. 引言在一个大的字符串中对一个小的子串进行定位称为字符串的模式匹配,这应该算是字符串中最重要的一个操作之一了.KMP本身不复杂,但网上绝大部分的文章把它讲混乱了.下面,咱们从暴力匹配算法讲起,随 ...

随机推荐

python 内置函数 : compile()
这个函数用来编译一段字符串的源码,结果可以生成字节码或者AST(抽像语法树),字节码可以使用函数exec()来执行,而AST可以使用eval()来继续编译. 参数source是一串字符串的源码,或者是 ...
[KOJ6023]合并果子·改
[COJ6023]合并果子·改试题描述在一个果园里,多多已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆.多多把这些果子堆排成一排,然后所有的果子合成一堆. 每一次合并,多多可以 ...
OpenCV成长之路(4)：图像直方图
一.图像直方图的概念图像直方图是反映一个图像像素分布的统计表,其实横坐标代表了图像像素的种类,可以是灰度的,也可以是彩色的.纵坐标代表了每一种颜色值在图像中的像素总数或者占所有像素个数的百分比. 图 ...
Opencv二值图像的分布直方图
Mat img; ]; int main() { VideoCapture video(); if (!video.isOpened()) { ; } Mat img; Mat img1, img2, ...
PyCharm 入手第一记
因为我是忠实的Linux用户,所以一下操作是在Linux下的完成,除了下载,因为Linux的下载着实有点让人捉急. PyCharm 下载地址: http://www.jetbrains.com/pyc ...
2016年11月14日--SQL创建数据库、表-查、插、删、改
--创建数据库(create database 数据库名)create database hq20161114go --使用选择数据库(use 数据库名)use hq20161114go --创建学生 ...
python 内置速度最快算法（堆排）
import random import time from heapq import heappush, heappop def heapsort(iterable): h = [] for val ...
ThinkPHP 知识点链接
1.Thinkphp3.2 行为扩展和插件(Hook) http://www.thinkphp.cn/topic/21323.html 2.ThinkPHP3.1.3的单字母函数汇总 ...
SQL Server 2012 自动增长列，值跳跃问题
介绍从 SQL Server 2012 版本开始, 当SQL Server 实例重启之后,表格的自动增长列的值会发生跳跃,而具体的跳跃值的大小是根据增长列的数据类型而定的.如果数据类型是整型(in ...
uml 推荐文章
http://blog.csdn.net/zfrong/article/details/4086424 http://www.cnblogs.com/ywqu/archive/2009/12/14/1 ...

理解KMP算法

理解KMP算法的更多相关文章

随机推荐

热门专题