用KMP算法实现strStr()
strStr()函数的用途是在一个字符串S中寻找某个字串P第一次出现的位置。并返回其下标,找不到时返回-1。最简单的办法就是找出S全部的子串和P进行比較,然而这种方法比較低效。假设我们从S的下标0和P的下标0開始对每一个字符进行比較,假设相等则下标添加,比較后面的字符。假设两者一直相等直到P的下标达到最大值。则表示在S中找到了P。而且第一次出现的位置为0,返回0,但假设在中间某个位置两个字符不相等时。这时S的下标要退回到1,P的下标回到0。又一次開始比較。
后来,有三个牛认为这样不爽。于是他们搞了一个KMP算法,并以他们三人名字的最開始字符命名这个算法。
这个算法的优点是在比較中的某个位置,两个串的字符不相等时。不须要S回退,而P的下标回退到某个值。然后继续和S当前失配的字符进行比較。
关键就是在这里了。P的下标要回退,退到哪儿啊?我们举个样例,S为“abcabcabeg”,P为"abcabe",从下标0開始比較,一直到下标5才发现字符不相等,S相应字符为c。P相应字符为e。这时候。我们就考查P中下标5曾经的字符串,即“abcab”。对于这个字符串,S下标5之前也存在相同的串。我们还发现这个串的前缀和后缀都有“ab”,即下标0、1和3、4分别组成的字符串相等,同一时候等于S串中下标3、4组成的字符串。因此。我们仅仅须要把P的下标退到2的位置。然后跟S的下标5相应的字符继续比較就可以,由于P的0、1下标相应字符和S的3、4下标相应的字符相等。假设对于每一个失配的位置,我们都这样对P的下标进行调整,而S的下标继续往前而不后退,效率会提高非常多。
如今最大的问题就是怎么计算P失配时应该退回到的下标值。而从前面的分析中能够看出是对字符串的前后缀相等部分的长度来获取的。这样问题就变成了怎么编写代码来较为高效地计算在失配时P调整到的新下标值。
对于P中每一个位置,我们能够计算出在该位置失配时应该调整到的下标,并存放在一个next数组中,比方上面P在下标为5时失配。调整到的新下标为2。则有next[5]等2。
写到这里,发现好像讲得越来越乱了。还是贴我自己的代码吧。事实上KMP最关键也是不太好理解的地方就是对next数组的理解和计算方法。
void fillNext(char* p, int* next)
{
if(!p) return;
int len = strlen(p);
int i = 1;
int j = 0;
for(int i = 0; i < len; ++i) next[i] = 0;
while(i < len-1)
{
if(p[i] == p[j])
{
i++;
j++;
next[i] = j;
}
else
{
if(j == 0)
{
i++;
next[i] = 0;
}
else j = next[j];
}
}
}
int strStr(char* haystack, char* needle) {
if(!haystack || !needle) return -1;
int len_h = strlen(haystack);
int len_n = strlen(needle);
if(len_n > len_h) return -1;
if(len_n == 0) return 0;
int* next = malloc(sizeof(int)*len_n);
fillNext(needle, next);
int i = 0;
int j = 0;
while(i < len_h)
{
if(haystack[i] == needle[j])
{
j++;
i++;
if(j == len_n)break;
}
else
{
if(j == 0)i++;
else j = next[j];
}
}
free(next);
if(j == len_n)
{
return i - len_n;
}
return -1;
}
用KMP算法实现strStr()的更多相关文章
- 70. Implement strStr() 与 KMP算法
Implement strStr() Implement strStr(). Returns a pointer to the first occurrence of needle in haysta ...
- Linux GCC下strstr的实现以及一个简单的Kmp算法的接口
今天做了一道题,要用判断一个字符串是否是另一个字符串的子串,于是查了一下strstr的实现. 代码如下: char *strstr(const char*s1,const char*s2) { con ...
- 第3章:LeetCode--算法:strStr KMP算法
https://leetcode.com/problems/implement-strstr/ 28. Implement strStr() 暴力算法: int ViolentMatch(char* ...
- 自己对kmp算法的理解,借由 28. 实现 strStr() 为例
做题思路 or 感想 : 就借由这道题来理解一下kmp算法吧 kmp算法的操作过程我觉得有句话很合适 :KMP 算法永不回退 目标字符串 的指针 i,不走回头路(不会重复扫描 目标字符串),而是借助 ...
- KMP算法的优化与详解
文章开头,我首先抄录一些阮一峰先生关于KMP算法的一些讲解. 下面,我用自己的语言,试图写一篇比较好懂的 KMP 算法解释. 1. 首先,字符串"BBC ABCDAB ABCDABCDABD ...
- KMP算法 --- 在文本中寻找目标字符串
KMP算法 --- 在文本中寻找目标字符串 很多时候,为了在大文本中寻找到自己需要的内容,往往需要搜索关键字.这其中就牵涉到字符串匹配的算法,通过接受文本和关键词参数来返回关键词在文本出现的位置.一般 ...
- KMP算法详细分解
1. 引言 给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题. Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的 ...
- 从头到尾测地理解KMP算法【转】
本文转载自:http://blog.csdn.net/v_july_v/article/details/7041827 1. 引言 本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP ...
- 很详尽KMP算法(厉害)
作者:July时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进.后收录于新书<编程之法:面试和算法心得>第4.4节中. 1. 引 ...
随机推荐
- ECMAScript 6 proxies
在ECMAScript 5里面,可以通过(writable 和 configurable)内部属性把属性设置为不可修改和不可删除的,可以通过(Object.preventExtensions() )让 ...
- 泛型DAO
最近正在学习泛型DAO,通过网上查阅资料,汇总并自己整理了一下.提前需要学习的知识java反射.泛型 用到的反射如下: Class<T>类 是java.lang包下,Class类的实例表示 ...
- 一起写框架-Ioc内核容器的实现-基础功能-ComponentScan支持组件注解限制(七)
实现功能 以上的代码我们发现.我们都是将@ComponentScan扫描的路径下的所有类都加载到容器中的. 而实际需求,我们并不希望所有的类都创建对象,而是加了组件注解@Controller,@Ser ...
- spring+struts2+hibernate整合
web.xml需要配置 <context-param> <param-name>contextConfigLocation</param-name> <par ...
- 利用C#实现分布式数据库查询
随着传统的数据库.计算机网络和数字通信技术的飞速发展,以数据分布存储和分布处理为主要特征的分布式数据库系统的研究和开发越来越受到人们的关注.但由于其开发较为复杂,在一定程度上制约了它的发展.基于此,本 ...
- python线程池实现多线程
参考文献 http://www.open-open.com/news/view/1c0179b http://blog.jobbole.com/52060/ 按照这个博客,实现获取多台服务器的空间使用 ...
- List实现
1.元素添加 #include <stdio.h> #include <stdlib.h> struct ListNode{ struct ListNode* next; in ...
- sso单点登录,单点登录原理图,单点登录图解,单点登录
sso单点登录,单点登录原理图,单点登录图解,单点登录 ============================== ©Copyright 蕃薯耀 2017年11月20日 http://www.cnb ...
- [Asp.Net Core] 1. IIS中的 Asp.Net Core 和 dotnet watch
在基于传统的.NET Framework的Asp.Net Mvc的时候,本地开发环境中可以在IIS中建立一个站点,可以直接把站点的目录指向asp.net mvc的项目的根目录.然后build一下就可以 ...
- Numpy入门 - 线性代数运算
本节矩阵线性代数有很多内容,这里重点演示计算矩阵的行列式.求逆矩阵和矩阵的乘法. 一.计算矩阵行列式[det] import numpy as np from numpy.linalg import ...