串匹配算法讲解 -----BF、KMP算法
参考文章:
http://www.matrix67.com/blog/archives/115
KMP算法详解
http://blog.csdn.net/yaochunnian/article/details/7059486
1、算法的思想
相比蛮力算法,KMP算法预先计算出了一个next数组,用来指导在匹配过程中匹配失败后尝试下次匹配的起始位置,以此避免重复的读入和匹配过程。这个next数组被叫做“部分匹配值表(**Particial match table**)”,它的设计是算法精妙之处。
对BF算法(每次S、T串都回溯)进行改进,尽量利用已经部分匹配的结果信息,尽量让 i 不回溯,加快模式串的滑动速度。
形象地说,就是假如第i+1个字符匹配失败之后,下一个可能匹配位置至少应该往后挪动多少。
2、部分匹配值表
要理解部分匹配值表,就得先了解字符串的前缀(prefix)和后缀(postfix)。
前缀:除字符串最后一个字符以外的所有头部串的组合。
后缀:除字符串第一个字符以外的所有尾部串的组合。
部分匹配值:一个字符串的前缀和后缀中最长共有元素的长度。
举例说明:字符串ABCAB
前缀:{A, AB, ABC, ABCA}
后缀:{BCAB, CAB, AB, B}
部分匹配值:2 (AB)
而所谓的部分匹配值表,则为模式串的所有前缀以及其本身的部分匹配值。
还是针对字符串ABCAB,它的部分匹配值表为:
A B C A B
0 0 0 1 2
啰嗦几句BF算法:
源码如下:包括BF,和KMP。串匹配算法:
1: // BF.cpp : 定义控制台应用程序的入口点。
2: //
3:
4: #include "stdafx.h"
5: #include "string"
6: #include <iostream>
7: using namespace std;
8:
9:
10: int index(string s,string t) /*求模式串t在主串s中的定位函数*/
11: {
12: int i,j,m,n;
13: i = 0;
14: j = 0;
15: n = s.length();
16: m = t.length();
17: while((i<n)&&(j<m))
18: {
19: if (s[i]== t[j])
20: {
21: i++;
22: j++;//可以认为是字符匹配成功的次数
23: }
24: else
25: {
26: i = i - j + 1;//可以认为是S当中每次比较的初始位置
27: j = 0;
28: }
29: }
30:
31: if ( j>=m )
32: return i - m + 1;
33: else
34: return -1;
35: }
36:
37:
38: int kmp(string s, string t,int next[])
39: {
40: int i,j,m,n;
41: i = 0;
42: j = 0;
43: n = s.length();
44: m = t.length();
45: while((i<n) && (j<m)) //循环控制条件
46: {
47: if (s[i]== t[j]) //如果两者相等,比较下一个字符
48: {
49: i++;
50: j++;
51: }
52: else //否则,j = next[j];
53: {
54: j = next[j];
55: }
56: }
57:
58: if ( j >= m ) //匹配成功,此时j的下标大于等于m
59: return i - m + 1;//返回匹配的起始下标
60: else
61: return -1;
62:
63: }
64:
65: void kmpNext(string str,int next[])
66: {
67: next[1] = 0;
68: int j = 1;
69: int k = 0;
70: while(j < str.length())
71: {
72: if ((k==0) || (str[j-1]==str[k-1])) //第一次匹配或者匹配成功,当t(k)==t(j)
73: {
74: j++;
75: k++; //继续匹配下一个字符
76: next[j] = k; //相当于next[j] = k + 1;
77: }
78: else
79: k = next[k]; //当t(k)!=t(j),将next[k]给k,然后回溯
80: }
81: }
82:
83:
84: int main()
85:
86: {
87: string Str,Tsr;
88:
89: int next[1000]={0,};
90: cout <<"请输入S串与T串:" <<endl;
91: cin >> Str >> Tsr;
92: cout << endl;
93: //int flag = index(Str,Tsr);
94:
95: kmpNext(Tsr,next);
96: int flag = kmp(Str,Tsr,next);
97: if (flag == -1)
98: {
99: cout << "没有找到子串"<<endl;
100: }
101: else
102: {
103: cout << "找到子串的位置为"<< flag <<endl;
104: }
105:
106:
107: return 0;
108: }
109:
.csharpcode, .csharpcode pre
{
font-size: small;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }
串匹配算法讲解 -----BF、KMP算法的更多相关文章
- 算法起步之kmp算法
[作者Idlear 博客:http://blog.csdn.net/idlear/article/details/19555905] 这估计是算法连载文章的最后几篇了,马上就要 ...
- 算法笔记之KMP算法
本文是<算法笔记>KMP算法章节的阅读笔记,文中主要内容来源于<算法笔记>.本文主要介绍了next数组.KMP算法及其应用以及对KMP算法的优化. KMP算法主要用于解决字符串 ...
- 字符串匹配(BF算法和KMP算法及改进KMP算法)
#include <stdio.h> #include <string.h> #include <stdlib.h> #include<cstring> ...
- 常用算法3 - 字符串查找/模式匹配算法(BF & KMP算法)
相信我们都有在linux下查找文本内容的经历,比如当我们使用vim查找文本文件中的某个字或者某段话时,Linux很快做出反应并给出相应结果,特别方便快捷! 那么,我们有木有想过linux是如何在浩如烟 ...
- 串的两种模式匹配方式(BF/KMP算法)
前言 串,又称作字符串,它是由0个或者多个字符所组成的有限序列,串同样可以采用顺序存储和链式存储两种方式进行存储,在主串中查找定位子串问题(模式匹配)是串中最重要的操作之一,而不同的算法实现有着不同的 ...
- 第4章学习小结_串(BF&KMP算法)、数组(三元组)
这一章学习之后,我想对串这个部分写一下我的总结体会. 串也有顺序和链式两种存储结构,但大多采用顺序存储结构比较方便.字符串定义可以用字符数组比如:char c[10];也可以用C++中定义一个字符串s ...
- 算法(贪心|BF|KMP)
贪心算法 前置知识 const Greedy = num => { //贪心 let arr = [100, 20, 10, 5, 2, 1] let count = 0; for (let i ...
- 问题 1690: 算法4-7:KMP算法中的模式串移动数组
题目链接:https://www.dotcpp.com/oj/problem1690.html 题目描述 字符串的子串定位称为模式匹配,模式匹配可以有多种方法.简单的算法可以使用两重嵌套循环,时间复杂 ...
- 迷宫城堡+算法讲解【tarjian算法】
Tarjan 算法 参考博客:https://www.cnblogs.com/shadowland/p/5872257.html 算法讲解 Tarjan 算法一种由Robert Tarjan提出的求解 ...
随机推荐
- Zookeeper在windows环境下安装
1.已安装JDK并配置好了环境变量 2.下载Zookeeper,在清华大学镜像下载,选择合适版本 https://mirrors.tuna.tsinghua.edu.cn/apache/zookee ...
- [python学习篇][廖雪峰][1]高级特性--列表生成式
>>> import os >>> [d for d in os.listdir(r"d:\temp")] ['0.png', '0.xml', ...
- struts拦截器详解
拦截器是Struts2最强大的特性之一,它是一种可以让用户在Action执行之前和Result执行之后进行一些功能处理的机制. 说到拦截器interceptor,就会想到过滤器filter: 过滤器f ...
- C++中使用Curl和JsonCpp调用有道翻译API实现在线翻译
使用C++开发一个在线翻译工具,这个想法在我大脑中过了好几遍了,所以就搜了下资料,得知网络上有很多翻译API,这里我选择我平时使用较多的有道翻译API进行在线翻译工具开发的练习.翻译API返回的结果常 ...
- Python之自动单元测试之一(unittest使用实例)
软件的测试是一件非常乏味的事情,在测试别人编写的软件时尤其如此,程序员通常都只对编写代码感兴趣,而不喜欢文档编写和软件测试这类"没有创新"的工作.既然如此,为什么不让程序员在编写软 ...
- 【Luogu】P1419寻找段落(单调队列)
题目链接 不知为何状态突然奇差无比,按说这题本来应该是水题的,但不仅不会做,还比着题解爆零五次 二分平均值(想到了),单调队列维护最大区间和(想到了但是不会,???为什么我不会???) #includ ...
- UVa——1593Alignment of Code(string重定向+vector数组)
UVA - 1593 Alignment of Code Time Limit: 3000MS Memory Limit: Unknown 64bit IO Format: %lld & ...
- samba安装和配置
windows和windows系统之间要实现文件共享是通过网络邻居实现linux和windows之间通过什么来实现文件共享呢?一.通过文件挂载(首先要制作ISO镜像文件,然后在用挂载命令)二.通过sa ...
- springboot获取getBean方法以及ApplicationContext空指针问题解决
创建获取ApplicationContext工具类: package com.performancetest.common.utils; import org.springframework.bean ...
- 金鹰教程网 FLASH8.0(AS)视频教程(下载地址)自认为最好的一个Flash教程
原文发布时间为:2008-07-29 -- 来源于本人的百度文章 [由搬家工具导入] 可以用迅雷新建批量任务下载,很方便的。 金鹰教程网 FLASH8.0教学视频 到目前(2008年7月29日21:2 ...