算法——字符串匹配Rabin-Karp算法

前言

Rabin-Karp字符串匹配算法和前面介绍的《朴素字符串匹配算法》类似，也是相应每一个字符进行比較。不同的是Rabin-Karp採用了把字符进行预处理，也就是对每一个字符进行相应进制数并取模运算，类似于通过某种函数计算其函数值，比較的是每一个字符的函数值。

预处理时间O(m)。匹配时间是O((n-m+1)m)。

Rabin-Karp算法的思想：

如果待匹配字符串的长度为M，目标字符串的长度为N（N>M）；
首先计算待匹配字符串的hash值，计算目标字符串前M个字符的hash值；
比較前面计算的两个hash值，比較次数N-M+1：
- 若hash值不相等，则继续计算目标字符串的下一个长度为M的字符子串的hash值
- 若hash值同样。则须要使用朴素算法再次推断是否为同样的字串；

Rabin-Karp算法实现

伪代码：

Rabin_Karp_search(T, P, d,  q)

	n = T.length;

	m = P.length;

	h = d^(m-1)mod q;

	p = 0;

	t = 0;

	for i =1 to m

	   p = (d*p+P[i]) mod q;

	   t = (d*t+T[i])mod q;

	for i = 0 to n-m

		 if p==t

			 if P[1..m]==T[i+1..i+m]

			 print"Pattern occurs with shift"i

		 if i<n-m

			 t = d(t-T[i+1]h) + T[i+m+1]mod q

源代码：

// Rabin Karp Algorithm 

#include<iostream>

#include<string>

using namespace std;

void Rabin_Karp_search(const string &T, const string &P, int d, int q)

{

    int m = P.length();

    int n = T.length();

    int i, j;

    int p = 0;  // hash value for pattern

    int t = 0; // hash value for txt

    int h = 1;

    // The value of h would be "pow(d, M-1)%q"

    for (i = 0; i < m-1; i++)

        h = (h*d)%q;

    // Calculate the hash value of pattern and first window of text

    for (i = 0; i < m; i++)

    {

        p = (d*p + P[i])%q;

        t = (d*t + T[i])%q;

    }

    // Slide the pattern over text one by one

    for (i = 0; i <= n - m; i++)

    {

        // Chaeck the hash values of current window of text and pattern

        // If the hash values match then only check for characters on by one

        if ( p == t )

        {

            /* Check for characters one by one */

            for (j = 0; j < m; j++)

               if (T[i+j] != P[j])

				   break;

            if (j == m)  // if p == t and pat[0...M-1] = txt[i, i+1, ...i+M-1]

               cout<<"Pattern found at index :"<< i<<endl;

        }

        // Calulate hash value for next window of text: Remove leading digit,

        // add trailing digit

        if ( i < n-m )

        {

            t = (d*(t - T[i]*h) + T[i+m])%q;

            // We might get negative value of t, converting it to positive

            if(t < 0)

              t = (t + q);

        }

    }

}

int main()

{

    string T = "Rabin–Karp string search algorithm: Rabin-Karp";

    string P = "Rabin";

    int q = 101;  // A prime number

	int d = 16;

    Rabin_Karp_search(T, P,d,q);

    system("pause");

    return 0;

}

參考资料：

《算法导论》

http://www.geeksforgeeks.org/searching-for-patterns-set-3-rabin-karp-algorithm/

算法——字符串匹配Rabin-Karp算法的更多相关文章

算法——字符串匹配之BM算法
前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...
实现字符串匹配的KMP算法
KMP算法是Knuth-Morris-Pratt算法的简称,它主要用于解决在一个长字符串S中匹配一个较短字符串s. 首先我们从整体来把我这个算法的思想. 字符串匹配的朴素算法: 我们容易想到朴素算法, ...
Luogu 3375 【模板】KMP字符串匹配（KMP算法）
Luogu 3375 [模板]KMP字符串匹配(KMP算法) Description 如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置. 为了减少骗分的情况,接下来 ...
字符串匹配的 Boyer-Moore 算法
上一篇文章,我介绍了字符串匹配的KMP算法但是,它并不是效率最高的算法,实际采用并不多.各种文本编辑器的” 查找” 功能(Ctrl+F),大多采用 Boyer-Moore 算法. 下面,我根据 M ...
字符串匹配的 KMP算法
一般字符串匹配过程 KMP算法是字符串匹配算法的一种改进版,一般的字符串匹配算法是:从主串(目标字符串)和模式串(待匹配字符串)的第一个字符开始比较,如果相等则继续匹配下一个字符, 如果不相等则从主串 ...
字符串匹配的kmp算法及 python实现
一:背景给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题. Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的常 ...
HDU 1711 Number Sequence (字符串匹配，KMP算法)
HDU 1711 Number Sequence (字符串匹配,KMP算法) Description Given two sequences of numbers : a1, a2, ...... , ...
字符串匹配（KMP 算法含代码）
主要是针对字符串的匹配算法进行解说有关字符串的基本知识传统的串匹配法模式匹配的一种改进算法KMP算法网上一比較易懂的解说小样例 1计算next 2计算nextval 代码有关字符串的基本知 ...
字符串匹配的KMP算法
~~~摘录来源:阮一峰~~~ 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串”BBC ABCDAB ABCDABCDABDE”,我想知道,里面是否包含另一个字符串”ABCDABD”? 许 ...

随机推荐

JavaScript 中的事件类型1（读书笔记思维导图）
Web 浏览器中可能发生的事件有很多类型.如前所述,不同的事件类型具有不同的信息,而“ DOM3级事件”规定了以下几类事件. UI(User Interface,用户界面)事件:当用户与页面上的元素交 ...
浅谈spring——spring MVC（十一）
springMVC框架主要是围绕DispatcherServlet这个核心展开,它负责拦截请求并将其分派给相应的的处理器处理,然后将结果响应给用户.包括注解驱动控制器.请求及响应信息处理.视图解析.本 ...
[置顶] github简单使用
git的介绍可以看这里 http://zh.wikipedia.org/wiki/GitHub 安装和使用参考的这个 http://www.cnblogs.com/cocowool/arch ...
UVA796- Critical Links(无向图中的桥梁)
题目链接题意: 给出一个无向图,按顺序输出桥思路:求出全部的桥,然后按顺序输出就可以代码: #include <iostream> #include <cstdio> # ...
currentstyle和getComputedStyle兼容问题
currentStyle:获取计算后的样式,也叫当前样式.终于样式. 长处:能够获取元素的终于样式,包含浏览器的默认值,而不像style仅仅能获取行间样式,所以更经常使用到. 注意:不能获取复合样式如 ...
DOS批处理延时技术
DOS批处理延时技术举个例子,我们要延时5秒打开gdh.txt这个文件,可以用以下几个方法方法一:ping 缺点:时间精度为1秒,不够精确 www.2cto.com @echo off ...
HDU 3639 Hawk-and-Chicken(良好的沟通）
HDU 3639 Hawk-and-Chicken 题目链接题意:就是在一个有向图上,满足传递关系,比方a->b, b->c,那么c能够得到2的支持,问得到支持最大的是谁,而且输出这些人 ...
【android】在Eclipse在联想引jar包源代码
(前提是你有jar包源代码!!) .确保Referenced LIbraies下已经有该jar包,否则的话,右击该jar包选build path->add to build path. 二.右键 ...
HGE引擎 - 绘制，声音，碰撞处理
原帖地址:http://blog.csdn.net/i_dovelemon/article/details/8818037 另外,年代久远,该引擎官网早已上不去了!!! 1.库的安装和下载从官网上h ...
快捷找jar包方式
通过例如以下站点查找jar包: 1.http://www.java2s.com/Code/Jar/o/Downloadorgapacheservicemixbundlescommonslang246j ...

算法——字符串匹配Rabin-Karp算法

前言

Rabin-Karp算法实现

算法——字符串匹配Rabin-Karp算法的更多相关文章

随机推荐

热门专题