stackoverflow中找到了一个时间复杂度分析很棒的链接 https://www.inf.hs-flensburg.de/lang/algorithmen/pattern/kmpen.htm

判断字符串 str 中是否包含子串 match。

next [i] : match [i-1] 结尾的后缀子串(不包含match [0])和 match [0] 开头的前缀子串,两者的最大匹配长度。

  1. 因为match[0] 前面没有字符串,规定 next [0] == -1
  2. 因为 next [i] 对应的子串不包含 match [0],所以next[1] = 0

假设当前 str[i ... j-1] 和 match [0 ... j-i-1]:若 str [j] != match [j-i]

  1. 若next [j] != -1,下一个比较的位置不是 str [i+1] 和 match [0],而是 str[j] 和 match [next [j-i]]
  2. 若next [j] = -1,说明 match 的索引指向 match [0],即 j - i = 0,并且在上一次比较中,match [0] != str [j],此时 str 的索引加1即可。

算法的精髓在于搞清楚一个问题:str [i] 和 str [j] 之间是否存在以 str [j-1] 结尾且长度大于 next[j-i] 的子串呢?

答案显然是否定的,这违反了 next 数组的定义。

时间复杂度:O(N),分析:

先看匹配过程:

  1. 方法的循环体中有3个分支。
  2. 循环中,si++发生的次数等于 s.length - 1。因此,进入前2个分支的次数是 s.length - 1。
  3. 其次,mi回退(match滑动)的过程等价于 match 对应 str 往右至少一个位置,显然它往右(match滑动)的最大次数是 s.length - m.length。因此,进入最后1个分支的次数是s.length - m.length。
  4. 所以循环发生的次数 2 * s.length - m.length + 1,即2N-M+1。

再看next数组生成:

  1. 方法的循环体中有3个分支。
  2. 循环中,pos++发生的次数等于 m.length - 2。因此,进其中2个分支的次数是 m.length - 2。
  3. 其次,cn回退最多发生多少次,受限制于 ++cn 执行了多少次,++cn 和 pos++ 同时发生最多发生的次数是 m.length - 2。
  4. 所以循环发生的次数 2 * m.length - 4,即2M-4。

最后看总复杂度:

  1. (2N-M+1) + (2M-4) = (2N+M-3) = O(2N+M)
  2. 因为 N >= M,O(2N+M) = O(3N) = O(N)
public static int getIndexOf(String s, String m) {
if (s == null || m == null || m.length() < 1 || s.length() < m.length()) {
return -1;
}
char[] ss = s.toCharArray();
char[] ms = m.toCharArray();
int si = 0;
int mi = 0;
int[] next = getNextArray(ms);
while (si < ss.length && mi < ms.length) {
if (ss[si] == ms[mi]) {
//匹配
si++;
mi++;
} else if (next[mi] == -1) {
//当前mi = 0,str[si] != match[0],si++即可
si++;
} else {
//滑动
mi = next[mi];
}
}
return mi == ms.length ? si - mi : -1;
}

怎么计算next数组?

  1. match [0] == -1,match[1] = 0(原因已经给出)。
  2. 从左至右依次计算,计算 next [i] 时已知 next [0 ... i-1]
  3. 我们可以利用 next [i - 1],若 match [i-1] = match [next [i-1]],那么 next [i] = next[i-1] + 1(再长的话与next数组定义违背)
  4. 若 match [i-1] != match [next [i-1]],则比较 match[i-1] 和 match[next[next[i-1]]],原因如下:
    1. 假设next[i-1] 对应前后缀分别是A和B,那么 next [next [i-1]] 则代表A的前后缀最大匹配长度。
    2. 由于A=B,因此A的前缀能对应B的后缀。
    3. 当前可能性不可能大于 next [next [i-1]] + 1,否则与next数组定义违背。
  5. 第3步和第4步递归执行,直到 next [k] = 0,则令 next [i] = 0。
public static int[] getNextArray(char[] ms) {
if (ms.length == 1) {
return new int[] { -1 };
}
int[] next = new int[ms.length];
next[0] = -1;
next[1] = 0;
//当前将要计算的位置
int pos = 2;
//当前将要被比较的位置
int cn = 0;
while (pos < next.length) {
if (ms[pos - 1] == ms[cn]) {
// cn是位置,长度=位置+1
next[pos++] = ++cn;
//此刻,cn = next[pos - 1]
} else if (cn > 0) {
cn = next[cn];
} else {
next[pos++] = 0;
//此刻,cn = next[pos-1] = 0
}
}
return next;
}

KMP(超详细复杂度分析)的更多相关文章

  1. 利用 Docker Compose 搭建 SpringBoot 运行环境(超详细步骤和分析)

    0.前言 相信点进来看这篇文章的同学们已经对 Docker Dompose 有一定的了解了,下面,我们拿最简单的例子来介绍如何使用 Docker Compose 来管理项目. 本文例子: 一个应用服务 ...

  2. PHP yield 分析,以及协程的实现,超详细版(上)

    参考资料 http://www.laruence.com/2015/05/28/3038.html http://php.net/manual/zh/class.generator.php http: ...

  3. ArrayList源码分析超详细(转载)

    ArrayList源码分析超详细   ArrayList源码分析超详解 想要分析下源码是件好事,但是如何去进行分析呢?以我的例子来说,我进行源码分析的过程如下几步: 找到类:利用 IDEA 找到所需要 ...

  4. 超强、超详细Redis数据库入门教程

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下 [本教程目录] 1.redis是什么2.redis的作者何许人也3.谁在使用red ...

  5. 超强、超详细Redis数据库入门教程(转载)

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下   [本教程目录] 1.redis是什么 2.redis的作者何许人也 3.谁在使 ...

  6. 超强、超详细Redis入门教程【转】

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下 [本教程目录] 1.redis是什么2.redis的作者何许人也3.谁在使用red ...

  7. 超详细Redis入门教程【转】

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下   [本教程目录] 1.redis是什么 2.redis的作者何许人也 3.谁在使 ...

  8. c语言面试宝典(经典,超详细)

    c语言面试宝典(经典,超详细) 2018年08月25日 09:32:19 chengxuyuan997 阅读数:7799   摘自:https://blog.csdn.net/chengxuyuan9 ...

  9. SPSS超详细操作:分层回归(hierarchical multiple regression)

    SPSS超详细操作:分层回归(hierarchical multiple regression) 1.问题与数据 最大携氧能力(maximal aerobic capacity, VO2max)是评价 ...

随机推荐

  1. A - Promotions

    题目详见http://7xjob4.com1.z0.glb.clouddn.com/3f644de6844d64706eb36baa3a0c27b0 这题是普通的拓扑排序,要把每一层的都保存下来. # ...

  2. Alice's mooncake shop HDU - 4122 单调队列

    题意: 有n个订单和可以在m小时内制作月饼,制作月饼不考虑时间(即,你可以在一个时刻在所有需要的月饼都做完) 接下来是n个订单的信息:需要在mon月,d日,year年,h小时交付订单r个月饼 接下来一 ...

  3. NCD 2019 M. NCD Salary

    题意 :给你两个指数类型的数\(A^m\)和\(B^n\),比较他们的大小.保证底数和指数中最多只有一个为0. 题解 :题目数据非常大,肯定不能直接比较.由换底公式和\(Log\)函数的性质我们知道: ...

  4. 牛客练习赛70 B.拼凑 (序列自动机)

    题意:有一个模板串,有\(T\)个字符串,从字符串中找到某个子串,使得这个子串中的子序列包含模板串,求最短的子串的长度. 题解:找子序列,很容易想到序列自动机,根据序列自动机的原理,我们一定可以确保除 ...

  5. 二叉排序树的构造 && 二叉树的先序、中序、后序遍历 && 树的括号表示规则

    二叉排序树的中序遍历就是按照关键字的从小到大顺序输出(先序和后序可没有这个顺序) 一.以序列 6 8 5 7 9 3构建二叉排序树: 二叉排序树就是中序遍历之后是有序的: 构造二叉排序树步骤如下: 插 ...

  6. 最小生成树 Prim和Kruskal

    感觉挺简单的,Prim和Dijkstra差不多,Kruskal搞个并查集就行了,直接上代码吧,核心思路都是找最小的边. Prim int n,m; int g[N][N]; int u,v; int ...

  7. Linux 设置简单密码

    centos: echo 密码 | passwd --stdin 用户名 ubuntu:(需先设置一个密码) sudo passwd username https://blog.csdn.net/mi ...

  8. 对于maven中无法加载类路径下的配置文件

    <build> <resources> <resource> <directory>src/main/java</directory> &l ...

  9. TypeScript Errors All In One

    TypeScript Errors All In One 1. Property 'name' has no initializer and is not definitely assigned in ...

  10. Microsoft Lifecycle Policy

    Microsoft Lifecycle Policy The Microsoft Lifecycle Policy gives you consistent and predictable guide ...