stackoverflow中找到了一个时间复杂度分析很棒的链接 https://www.inf.hs-flensburg.de/lang/algorithmen/pattern/kmpen.htm

判断字符串 str 中是否包含子串 match。

next [i] : match [i-1] 结尾的后缀子串(不包含match [0])和 match [0] 开头的前缀子串,两者的最大匹配长度。

  1. 因为match[0] 前面没有字符串,规定 next [0] == -1
  2. 因为 next [i] 对应的子串不包含 match [0],所以next[1] = 0

假设当前 str[i ... j-1] 和 match [0 ... j-i-1]:若 str [j] != match [j-i]

  1. 若next [j] != -1,下一个比较的位置不是 str [i+1] 和 match [0],而是 str[j] 和 match [next [j-i]]
  2. 若next [j] = -1,说明 match 的索引指向 match [0],即 j - i = 0,并且在上一次比较中,match [0] != str [j],此时 str 的索引加1即可。

算法的精髓在于搞清楚一个问题:str [i] 和 str [j] 之间是否存在以 str [j-1] 结尾且长度大于 next[j-i] 的子串呢?

答案显然是否定的,这违反了 next 数组的定义。

时间复杂度:O(N),分析:

先看匹配过程:

  1. 方法的循环体中有3个分支。
  2. 循环中,si++发生的次数等于 s.length - 1。因此,进入前2个分支的次数是 s.length - 1。
  3. 其次,mi回退(match滑动)的过程等价于 match 对应 str 往右至少一个位置,显然它往右(match滑动)的最大次数是 s.length - m.length。因此,进入最后1个分支的次数是s.length - m.length。
  4. 所以循环发生的次数 2 * s.length - m.length + 1,即2N-M+1。

再看next数组生成:

  1. 方法的循环体中有3个分支。
  2. 循环中,pos++发生的次数等于 m.length - 2。因此,进其中2个分支的次数是 m.length - 2。
  3. 其次,cn回退最多发生多少次,受限制于 ++cn 执行了多少次,++cn 和 pos++ 同时发生最多发生的次数是 m.length - 2。
  4. 所以循环发生的次数 2 * m.length - 4,即2M-4。

最后看总复杂度:

  1. (2N-M+1) + (2M-4) = (2N+M-3) = O(2N+M)
  2. 因为 N >= M,O(2N+M) = O(3N) = O(N)
  1. public static int getIndexOf(String s, String m) {
  2. if (s == null || m == null || m.length() < 1 || s.length() < m.length()) {
  3. return -1;
  4. }
  5. char[] ss = s.toCharArray();
  6. char[] ms = m.toCharArray();
  7. int si = 0;
  8. int mi = 0;
  9. int[] next = getNextArray(ms);
  10. while (si < ss.length && mi < ms.length) {
  11. if (ss[si] == ms[mi]) {
  12. //匹配
  13. si++;
  14. mi++;
  15. } else if (next[mi] == -1) {
  16. //当前mi = 0,str[si] != match[0],si++即可
  17. si++;
  18. } else {
  19. //滑动
  20. mi = next[mi];
  21. }
  22. }
  23. return mi == ms.length ? si - mi : -1;
  24. }

怎么计算next数组?

  1. match [0] == -1,match[1] = 0(原因已经给出)。
  2. 从左至右依次计算,计算 next [i] 时已知 next [0 ... i-1]
  3. 我们可以利用 next [i - 1],若 match [i-1] = match [next [i-1]],那么 next [i] = next[i-1] + 1(再长的话与next数组定义违背)
  4. 若 match [i-1] != match [next [i-1]],则比较 match[i-1] 和 match[next[next[i-1]]],原因如下:
    1. 假设next[i-1] 对应前后缀分别是A和B,那么 next [next [i-1]] 则代表A的前后缀最大匹配长度。
    2. 由于A=B,因此A的前缀能对应B的后缀。
    3. 当前可能性不可能大于 next [next [i-1]] + 1,否则与next数组定义违背。
  5. 第3步和第4步递归执行,直到 next [k] = 0,则令 next [i] = 0。
  1. public static int[] getNextArray(char[] ms) {
  2. if (ms.length == 1) {
  3. return new int[] { -1 };
  4. }
  5. int[] next = new int[ms.length];
  6. next[0] = -1;
  7. next[1] = 0;
  8. //当前将要计算的位置
  9. int pos = 2;
  10. //当前将要被比较的位置
  11. int cn = 0;
  12. while (pos < next.length) {
  13. if (ms[pos - 1] == ms[cn]) {
  14. // cn是位置,长度=位置+1
  15. next[pos++] = ++cn;
  16. //此刻,cn = next[pos - 1]
  17. } else if (cn > 0) {
  18. cn = next[cn];
  19. } else {
  20. next[pos++] = 0;
  21. //此刻,cn = next[pos-1] = 0
  22. }
  23. }
  24. return next;
  25. }

KMP(超详细复杂度分析)的更多相关文章

  1. 利用 Docker Compose 搭建 SpringBoot 运行环境(超详细步骤和分析)

    0.前言 相信点进来看这篇文章的同学们已经对 Docker Dompose 有一定的了解了,下面,我们拿最简单的例子来介绍如何使用 Docker Compose 来管理项目. 本文例子: 一个应用服务 ...

  2. PHP yield 分析,以及协程的实现,超详细版(上)

    参考资料 http://www.laruence.com/2015/05/28/3038.html http://php.net/manual/zh/class.generator.php http: ...

  3. ArrayList源码分析超详细(转载)

    ArrayList源码分析超详细   ArrayList源码分析超详解 想要分析下源码是件好事,但是如何去进行分析呢?以我的例子来说,我进行源码分析的过程如下几步: 找到类:利用 IDEA 找到所需要 ...

  4. 超强、超详细Redis数据库入门教程

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下 [本教程目录] 1.redis是什么2.redis的作者何许人也3.谁在使用red ...

  5. 超强、超详细Redis数据库入门教程(转载)

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下   [本教程目录] 1.redis是什么 2.redis的作者何许人也 3.谁在使 ...

  6. 超强、超详细Redis入门教程【转】

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下 [本教程目录] 1.redis是什么2.redis的作者何许人也3.谁在使用red ...

  7. 超详细Redis入门教程【转】

    这篇文章主要介绍了超强.超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下   [本教程目录] 1.redis是什么 2.redis的作者何许人也 3.谁在使 ...

  8. c语言面试宝典(经典,超详细)

    c语言面试宝典(经典,超详细) 2018年08月25日 09:32:19 chengxuyuan997 阅读数:7799   摘自:https://blog.csdn.net/chengxuyuan9 ...

  9. SPSS超详细操作:分层回归(hierarchical multiple regression)

    SPSS超详细操作:分层回归(hierarchical multiple regression) 1.问题与数据 最大携氧能力(maximal aerobic capacity, VO2max)是评价 ...

随机推荐

  1. 回溯法、子集树、排列树、满m叉树

    显示图: 明确给出了图中的各顶点及边 隐式图: 仅给出初始节点.目标节点及产生子节点的条件(一般有问题提议隐含给出)的情况下,构造一个图. 回溯法: 从初始状态出发,在隐式图中以深度优先的方式搜索问题 ...

  2. 【noi 2.6_9283】&【poj 3088】Push Botton Lock(DP--排列组合 Stirling数)

    题意:N个编号为1~N的数,选任意个数分入任意个盒子内(盒子互不相同)的不同排列组合数. 解法:综合排列组合 Stirling(斯特林)数的知识进行DP.C[i][j]表示组合,从i个数中选j个数的方 ...

  3. Django用户注册、登录

    一.用户注册 1 ''' 2 注册的表单模型 3 forms.py 的例子 4 ''' 5 6 from django import forms #表单功能 7 from django.contrib ...

  4. cmder设置方法

    一.添加鼠标右键 Cmder.exe /REGISTER ALL 二.添加系统环境变量 我的电脑 > 右键属性 > 高级系统设置 > 环境变量 > 系统变量,在path中添加 ...

  5. appveyor build failed --

    在 https://www.cnblogs.com/lqerio/p/11117498.html 使用了appveyor 进行 hexo 博客的版本控制持续集成. 今天push 到 github的 r ...

  6. 【非原创】LightOJ - 1284 Lights inside 3D Grid【概率期望】

    学习博客: 戳这里 戳这里 戳这里 戳这里 题意: 在一个三维的空间,每个点都有一盏灯,开始全是关的, 现在每次随机选两个点,把两个点之间的全部点,开关都按一遍:问k次过后开着的灯的期望数量: 题解: ...

  7. redis持久化-AOF

    1.aof文件写入与同步 2.aof重写 重写的目的是为了减小aof文件的体积,redis服务器可以创建一个新的aof文件来代替现有的aof文件,新文件不会有冗余的命令. BGREWRITEAOF:遍 ...

  8. useful tools for programmer programming

    useful tools for programmer programming devtools repl & playground https://repl.it/@xgqfrms/ htt ...

  9. js 获取包含emoji的字符串的长度

    let emoji_exp = /(\u00a9|\u00ae|[\u2000-\u3300]|\ud83c[\ud000-\udfff]|\ud83d[\ud000-\udfff]|\ud83e[\ ...

  10. Puppeteer: 虚拟键盘

    文档 main.js const pptr = require('puppeteer'); const gotoUrl = 'http://127.0.0.1:5500/index.html'; (a ...