KMP 算法实现

# coding=utf-8

def get_next_list(findding_str):  # O(m)

    # 求一个字符串序列每个位置的最长相等前、后缀

    j = 0  # 最长相等前缀的末位

    next = [0]  # next 数组用于保存字符串每个位置的最长相等前、后缀的长度值

    # i 是最长相等后缀的末位

    for i in range(1, len(findding_str)):

        while j > 0 and findding_str[i] != findding_str[j]:

            # 如果当前 前缀末位（j）字符与当前i位置的字符不相等时，j回退 PS：j的值也表示findding_str[：i+1]最长相等前、后缀的长度值

            j = next[j-1]

        if findding_str[i] == findding_str[j]:

            j += 1

        next.append(j)

    return next

def KMP(findding_str, next, parent_str):  # O(n)

    ind = 0

    for i in range(len(parent_str)):

        while parent_str[i] != findding_str[ind]:

            if ind == 0:

                break

            # parent_str[i] != findding_str[ind]  且  ind != 0 时，从findding_str[ind] 左侧的字符串的最大相等前缀处开始比较

            ind = next[ind-1]

        if parent_str[i] == findding_str[ind]:

            ind += 1

            if ind == len(findding_str):

                print(i, ind, parent_str[i - ind + 1: i+1])

                ind = 0

                # break

if __name__ == '__main__':

    parent_str = 'aabafgggahaabaafaabaahatjhrtjabaafaabaahaabaafaabaahaabaaf'

    findding_str = 'aabaaf'

    KMP(findding_str, get_next_list(findding_str), parent_str)

当在 j 处失配时，j -> next[j] 是说回溯到位置 next[j]

注意，next[j] 的位置的含义是什么？是对齐了已经匹配好的串的位置。

下图中，红色的方格是失配处。一旦失配，j 发生回溯跳转，

因为新位置左边的串已经是匹配好的（这正是 next 数组的含义，前后公共缀的长度），所以无需回溯到头。

按上面的图，数一数，绿色的是匹配上的字符，红色的是失配的地方，横向 n 个，

纵向 m 个，总共 m + n 次比对。

每次失配，子串回溯，对齐已匹配串，在失配处原地再匹配一次主串对应字符

所以，kmp 的比对次数是 (n + 失配次数）

KMP 算法的最差情况的一个案例，n/m 个失配点位，每个点位重新匹配 m-1 次，此时总共比对 n+(m-1)*(n/m) 次，接近 2n 次。

如果不考虑搜索到的情况，最好情况如下，总共比对 n+1*(n/m) 次，如果 m 很小，也接近 2n 次，如果 m 比较大，就接近 n 次。

算上预处理阶段O(m)，KMP 在最好、最坏的情况下的时间复杂度都是 O(m+n)

参考链接：https://segmentfault.com/q/1010000014560162

KMP 算法实现的更多相关文章

简单有效的kmp算法
以前看过kmp算法,当时接触后总感觉好深奥啊,抱着数据结构的数啃了一中午,最终才大致看懂,后来提起kmp也只剩下“奥,它是做模式匹配的”这点干货.最近有空,翻出来算法导论看看,原来就是这么简单(先不说 ...
KMP算法
KMP算法是字符串模式匹配当中最经典的算法,原来大二学数据结构的有讲,但是当时只是记住了原理,但不知道代码实现,今天终于是完成了KMP的代码实现.原理KMP的原理其实很简单,给定一个字符串和一个模式串 ...
萌新笔记——用KMP算法与Trie字典树实现屏蔽敏感词（UTF-8编码）
前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"* ...
KMP算法实现
链接:http://blog.csdn.net/joylnwang/article/details/6778316 KMP算法是一种很经典的字符串匹配算法,链接中的讲解已经是很明确得了,自己按照其讲解 ...
数据结构与算法JavaScript (五) 串(经典KMP算法)
KMP算法和BM算法 KMP是前缀匹配和BM后缀匹配的经典算法,看得出来前缀匹配和后缀匹配的区别就仅仅在于比较的顺序不同前缀匹配是指:模式串和母串的比较从左到右,模式串的移动也是从左到右后缀匹配 ...
扩展KMP算法
一问题定义给定母串S和子串T,定义n为母串S的长度,m为子串T的长度,suffix[i]为第i个字符开始的母串S的后缀子串,extend[i]为suffix[i]与字串T的最长公共前缀长度.求出所 ...
字符串模式匹配之KMP算法图解与 next 数组原理和实现方案
之前说到,朴素的匹配,每趟比较,都要回溯主串的指针,费事.则 KMP 就是对朴素匹配的一种改进.正好复习一下. KMP 算法其改进思想在于: 每当一趟匹配过程中出现字符比较不相等时,不需要回溯主串的 ...
算法：KMP算法
算法:KMP排序算法分析 KMP算法是一种快速的模式匹配算法.KMP是三位大师:D.E.Knuth.J.H.Morris和V.R.Pratt同时发现的,所以取首字母组成KMP. 少部分图片来自孤~影 ...
BF算法与KMP算法
BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符:若不相等,则比较S的 ...
KMP算法-next函数求解
KMP函数求解:一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为KMP算法.KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串 ...

随机推荐

迁移学习（IIMT）——《Improve Unsupervised Domain Adaptation with Mixup Training》
论文信息论文标题:Improve Unsupervised Domain Adaptation with Mixup Training论文作者:Shen Yan, Huan Song, Nanxia ...
linux环境编程(1): 实现一个单元测试框架
写在前面在开发的过程中,大多数人都需要对代码进行测试.目前对于c/c++项目,可以采用google的gtest框架,除此之外在github上搜索之后可以发现很多其他类似功能的项目.但把别人的轮子直接 ...
Java入门与进阶P-4.5+P-4.6
逻辑类型关系运算的结果是要给逻辑值,true或false.这个值可以保存在一个对应的逻辑类型变量中,这样的变量类型是boolean 布尔是为了纪念George Boole对逻辑计算得到贡献 bool ...
我为什么要放弃RESTful，选择拥抱GraphQL
背景 REST作为一种现代网络应用非常流行的软件架构风格,自从Roy Fielding博士在2000年他的博士论文中提出来到现在已经有了20年的历史.它的简单易用性,可扩展性,伸缩性受到广大Web开发 ...
二分查找 & 移除元素
一.二分查找 704.二分查找 leetcode链接 1.二分查找方法概述二分查找是针对有序数组的一种查找方式.是利用(letf+right)/2 = mid的方式来对半缩短搜索范围的一种方法,一次 ...
解析sensor_msgs::PointCloud2 ROS点云数据
1.一个仿真的点云数据 header: seq: 2116 stamp: secs: 1586919439 nsecs: 448866652 frame_id: "LidarSensor1& ...
Ubuntu18.04中用CMake-gui安装OpenCV3.2.0和OpenCV_contrib-3.2.0
下载和添加依赖包1.首先更新 apt-get,在安装前最好先更新一下系统,不然有可能会安装失败.在终端输入: sudo apt-get update sudo apt-get upgrad ...
学习Java Day12
今天学习了多维数组
如何使用 ArrayPool
如果不停的 new 数组,可能会造成 GC 的压力,因此在 aspnetcore 中推荐使用 ArrayPool 来重用数组,本文将介绍如何使用 ArrayPool. 使用 ArrayPool Arr ...
2021级《JAVA语言程序设计》上机考试试题10
教学副院长功能页 <%@ page language="java" contentType="text/html; charset=UTF-8" page ...

KMP 算法实现

KMP 算法实现的更多相关文章

随机推荐

热门专题