要得到某个结果,可以有很多种方式,算法就是为了寻找一条最快的方式。

而评判其好坏的标准就是时间复杂度。

O(1):

  我们把执行一次的时间复杂度定义为O(1)

  sum = a +b;

  cout << sum <<endl;

O(n):

  for(int i = 0; i < n ;++n)

  {  

    //do something.

  }

O(n2):

for(int i = 0; i < n ;++n)

  {  

   for(int j = 0; j < n ;++n)

    {

      //do something.

    }

  }

我们会碰到这样的需求,从一个主字符串中找到一个子串,首先我们想到的是这种方法:

#include "stdafx.h"
#include<iostream>
#include<string>
using namespace std;

int findString(string S,string T)
{
    int i = 0;
    int j = 0;
    while(i<S.length() && j < T.length())
    {
        if(T[j] == S[i])
        {
            i++;
            j++;
        }
        else
        {
            j=0;
            i = i-j+1;
        }
    }
    if(j = T.length())
    {
        return i-j;
    }
    else
    {
        return -1;
    }
}

void main()
{
    int a = findString("adsfdjfxdf","xdf");
    cout << a <<endl;
    cin.get();
    cin.get();
}

时间复杂度为O(n*m)这个好理解,每比较m次,主字符串位置加1,最坏的情况就是比较n*m次

而实际上,我们不需要这样做,例如如果要在主字符串中找abcd,那每次i可以加4,下次直接从第5个开始比较。这样的时间复杂度是O(n/m*m) = O(n),而实际上我们要找的子串有可能会重复,于是一种更通用的算法就产生了, 克努特一莫里斯一普拉特算法, 简称 KMP 算法

主要思想基于上图,找到的比较便于理解的图,上图中1,2,3,4为相同内容,中间蓝色为相同内容,当我们第一次比较时,发现A和B不同,那么下一次比较时,我们主串仍从A开

始,而子串则从C处开始,3和2相同的内容便不再需要比较。具体解释百度,其实一看就能感觉应该是这样,而i从上次比较失败的地方继续开始在代码上逻辑也不混乱。

因此KMP算法比较关键的便是如何得到子串失败后开始的这个点C,为了得到这个C的位置i,KMP这3个人设计了一个中间数组,来保存子串的若比较失败应该开始的下一个比较点。

next数组, 含义就是一个固定字符串的最长前缀和最长后缀相同的长度。

比如:abcjkdabc,那么这个数组的最长前缀和最长后缀相同必然是abc。

cbcbc,最长前缀和最长后缀相同是cbc。   这个子串的next数组是[0,0,1,2,0]

#include "stdafx.h"
#include<iostream>
#include<string>
using namespace std;

void get_next(string T,int* next)
{
    next[0] = -1;
    int i = 0;
    int j = -1;
    while(i<T.length())
    {
        if((j == (-1)) || (T[i] == T[j]))
        {
            next[++i] = ++j;
        }
        else
        {
            j = next[j];   //可以想象两个子串如上图一样的比较
        }
    }
}

int KMP(string S , string T)
{
    int * next = new int[T.length()+1];
    int i = 0;
    int j = 0;
    get_next(T, next);
    while(i < int(S.length()) && j < int(T.length()))
    {
        if((-1 == j) || S[i] == T[j])
        {
            i++;
            j++;
        }
        else
        {
            j=next[j];      //如上图4区域刚好是next[j]不需要比较,从c处开始比较
        }
    }
    delete []next;
    if(j == T.length())
    {
        return i-j;
    }
    else
    {
        return -1;
    }
}

void main()
{
    string S;
    string T;
    cout<<"please input the Mstring:"<<endl;
    cin>>S;
    cout<<endl<<"please input the Cstring:"<<endl;
    cin >>T;
    cout<<S.length()<<endl;
    cout<<T.length()<<endl;
    cout<<"the child String in the M number is: "<< KMP(S,T);
    system("pause");
}

这个时间复杂度是O(m+n),因为是两个单循环相加。

写这个的时候 while(i < int(S.length()) && j < int(T.length())) 这句没有强转化int,导致j = -1时while循环只执行了一次未继续下去,后来看了一下length返回的并不是int,而是一个抽象的size,被这个错误搞得有点心态崩了。

O(1)

时间复杂度O()与KMP算法的更多相关文章

  1. KMP算法具体解释(转)

    作者:July. 出处:http://blog.csdn.net/v_JULY_v/. 引记 此前一天,一位MS的朋友邀我一起去与他讨论高速排序,红黑树,字典树,B树.后缀树,包含KMP算法,只有在解 ...

  2. 字符串匹配算法之 kmp算法 (python版)

    字符串匹配算法之 kmp算法 (python版) 1.什么是KMP算法 KMP是三位大牛:D.E.Knuth.J.H.MorriT和V.R.Pratt同时发现的.其中第一位就是<计算机程序设计艺 ...

  3. KMP 算法学习

    KMP算法是用来做字符串匹配的.关于字符串匹配,最简单最容易想到的方法是暴利查找,使用双重for循环处理. 该方法的时间复杂度为O((n-m+1)*m) (n为目标串T长度,m为模式串P长度, 从T中 ...

  4. KMP算法的时间复杂度与next数组分析

    一.什么是 KMP 算法 KMP 算法是一种改进的字符串匹配算法,用于判断一个字符串是否是另一个字符串的子串 二.KMP 算法的时间复杂度 O(m+n) 三.Next 数组 - KMP 算法的核心 K ...

  5. 简单有效的kmp算法

    以前看过kmp算法,当时接触后总感觉好深奥啊,抱着数据结构的数啃了一中午,最终才大致看懂,后来提起kmp也只剩下“奥,它是做模式匹配的”这点干货.最近有空,翻出来算法导论看看,原来就是这么简单(先不说 ...

  6. 字符串模式匹配之KMP算法图解与 next 数组原理和实现方案

    之前说到,朴素的匹配,每趟比较,都要回溯主串的指针,费事.则 KMP 就是对朴素匹配的一种改进.正好复习一下. KMP 算法其改进思想在于: 每当一趟匹配过程中出现字符比较不相等时,不需要回溯主串的 ...

  7. BF算法与KMP算法

    BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符:若不相等,则比较S的 ...

  8. 经典KMP算法C++与Java实现代码

    前言: KMP算法是一种字符串匹配算法,由Knuth,Morris和Pratt同时发现(简称KMP算法).KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的.比 ...

  9. [Algorithm] 字符串匹配算法——KMP算法

    1 字符串匹配 字符串匹配是计算机的基本任务之一. 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串& ...

随机推荐

  1. xss处理

    今天学习了xss,主要记载如下: https://blog.csdn.net/sdauzyh/article/details/74942737

  2. Python01(linux基础)

    聊一聊计算机 CPU,电源相关,时钟部分(主频),存储器,输入输出系统 计算机记忆装置:存储器分两大类:1.内存Ram(速度快,容量小(相对),断电后内容丢失) 非持久性记忆存储器2.如:硬盘,(速度 ...

  3. Tmux会话-基本操作及原理

    一.Tmux命令介绍: Tmux (“Terminal Multiplexer”的简称), 是一款优秀的终端复用软件,类似 GNU screen,但比screen更出色. tmux来自于OpenBSD ...

  4. 两种语言实现设计模式(C++和Java)(二:单例模式)

    本篇介绍单例模式,可以说是使用场景最频繁的设计模式了.可以根据实例的生成时间,分为饿汉模式和懒汉模式 懒汉模式:饿了肯定要饥不择食.所以在单例类定义的时候就进行实例化. 饿汉模式:故名思义,不到万不得 ...

  5. Charles抓包遇到的问题

    1.手机设置了代理但是连不上网,无法下载HTTPS证书,关闭电脑防火墙! 2.content乱码解决方案参考https://www.cnblogs.com/puresoul/p/7365761.htm ...

  6. golang context

    ex1 package main import ( "fmt" ) // 最佳context 实践 // Context 目标是实现各个goroutine能及时终止退出. func ...

  7. 获取choice的value

  8. MAC 终端上传代码到Github 或者 Gitlab

    1.创建远程仓库. Project name:项目名称 Project description (optional):项目介绍 Visibility Level :项目的访问权限 2.创建完成后操作, ...

  9. IOS 生成静态库文件(.a文件)

    http://www.cnblogs.com/lyy-5518/p/5459643.html

  10. D1——初读《Head First Java》

    今天随便看了点<Head First Java>,发觉这本书的风格真是有趣.打算先把这本书踏踏实实的看了.学习切忌好高骛远.心浮气躁,尤其入门基础阶段更应该踏踏实实地学习知识.下面随便谈谈 ...