Sunday算法是Daniel M.Sunday于1990年提出的字符串模式匹配算法。相对比较KMP和BM算法而言,简单了许多。

  Sunday算法的思想类似于BM算法中的坏字符思想,有点像其删减版。差别在于Sunday算法在失配之后,是取目标串中当前和模式串匹配的部分后面一个位置的字符来做坏字符匹配。其时间复杂度和BM算法差不多,平均性能的时间复杂度也为O(n)。Sunday算法的位移比BM算法更大,所以Sunday算法的效率比BM算法更高,在匹配随机字符串时效率比其他匹配算法快。最差情况的时间复杂度为O(n * m),考虑如下目标串:baaaabaaaabaaaabaaaa,在里面搜索aaaaa,没有匹配位置。如果用Sunday算法,坏字符大部分都是a,而模式串中又全部都是a,所以在大部分情况下,失配后模式串只能往右移动1位。

匹配原理:从前往后匹配,如果不匹配,则根据母串S对齐部分的最后一个字符的下一个字符进行判断:如果该字符出现在模板串T中,则选择最右出现的位置进行对齐;否则,直接跳过该匹配区域。

  母串S:s e a r c h s u b s t r i n g

  模板串T:s u b s t r i n g

  开始匹配(第1个字符):

  s e a r c h s u b s t r i n g

  s u b s t r  i n g

  继续下一字符匹配(第2个字符):

  s e a r c h s u b s t r i n g

  s u b s t r  i  n g

  出现不匹配情况,查找母串对齐部分的最后一个字符的下一个字符s。在T中,字符s出现两次,按照原理,选择最右位置出现的s进行对齐,那么可以得到:

  s e a r c h s u b s t r i n g

                   s u b s t r i n g

  假设母串S为:s e a r c h s u b z t r i n g

  那么当匹配到上述情况时,字符z在T中没有出现,那么就可以得到下面的情况:

  s e a r c h s u b z t r i n g

         s u b s t r i n g

  这就是其原理的两种情况。

  Java语言实现(s表示母串,t表示模板串):

 public class Sunday {
// 数组容量可变,依字符范围而定
private static final int MAX_SIZE = 65536;
// 匹配失败时的移动距离
private static final int[] MOVE_LENGTH = new int[MAX_SIZE]; // 设置移动距离
private static void setMoveLength(int tLen, String t) {
int tLenPlusOne = tLen + 1;
// 默认子串中的任何字符不出现在母串中,移动距离是子串长度 + 1
for (int i = 0; i < MAX_SIZE; i++) {
MOVE_LENGTH[i] = tLenPlusOne;
} // 确定母串匹配部分最后一个字符的下一个字符在子串中最右出现的位置
for (int i = 0; i < tLen; i++) {
MOVE_LENGTH[t.charAt(i)] = tLen - i;
}
} // 顺序查找指定子串在指定母串中首次出现的位置
public static int indexOf(String s, String t) {
// 如果两个字符串至少有一个是null
if (s == null || t== null) {
return -1;
} // 获取字符串长度
int sLen = s.length();
int tLen = t.length();
// 设置移动距离
setMoveLength(tLen, t); // i是母串遍历下标
for (int i = 0; i < sLen; ) {
// j是子串遍历下标
int j = 0;
// 不断匹配字符
while (j < tLen && i + j < sLen && s.charAt(i + j) == t.charAt(j)) {
j++;
} // 如果查找成功
if (j == tLen) {
return i;
} // 向右移动距离最小是1,i + tLen是匹配时最后一个字符下标
// 如果该下标越界,则查找失败
if (i + tLen >= sLen) {
return -1;
} // 右移对齐
i += MOVE_LENGTH[s.charAt(i + tLen)];
} // 查找失败
return -1;
} public static void main(String[] args) {
String s = "searchsubstring";
String t = "substring";
System.out.println(indexOf(s, t));
} }

  结果:

6

  参考资料

  【模式匹配】之 —— Sunday算法

  数据结构与算法系列----Sunday算法详解

BF、KMP、BM、Sunday算法讲解

数据结构 Sunday算法的更多相关文章

  1. 字符串模式匹配sunday算法

    文字部分转自:http://www.cnblogs.com/mr-ghostaqi/p/4285868.html 代码是我自己写的 今天在做LeetCode的时候,碰到一个写字符串匹配的题目: htt ...

  2. Sunday算法解决字符串匹配问题

    概述 提起字符串匹配可能更多人会想到KMP算法,该算法时间复杂度为O(m+n),而且也是我们在学习数据结构过程中最早接触到的比较好的算法.但KMP算法需要在模式字符串有关联的情况下,也即模式字符串前后 ...

  3. 开启基本数据结构和算法之路--初识Graphviz

    在我的Linux刀耕开荒阶段,就想开始重拾C,利用C实现常用的基本数据结构和算法,而数据结构和算法的掌握的熟练程度正是程序的初学者与职业程序员的分水岭. 那么怎么开启这一段历程呢? 按照软件工程的思想 ...

  4. 【转】MySQL索引背后的数据结构及算法原理

    摘要 本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题.特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BT ...

  5. [转]MySQL索引背后的数据结构及算法原理

    摘要 本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题.特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BT ...

  6. MySQL索引背后的数据结构及算法原理【转】

    本文来自:张洋的MySQL索引背后的数据结构及算法原理 摘要 本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题.特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持 ...

  7. 数据结构与算法JavaScript (一) 栈

    序 数据结构与算法JavaScript这本书算是讲解得比较浅显的,优点就是用javascript语言把常用的数据结构给描述了下,书中很多例子来源于常见的一些面试题目,算是与时俱进,业余看了下就顺便记录 ...

  8. 数据结构与算法 Big O 备忘录与现实

    不论今天的计算机技术变化,新技术的出现,所有都是来自数据结构与算法基础.我们需要温故而知新.        算法.架构.策略.机器学习之间的关系.在过往和技术人员交流时,很多人对算法和架构之间的关系感 ...

  9. 《java数据结构和算法》读书笔记

    大学时并不是读计算机专业的, 之前并没有看过数据结构和算法,这是我第一次看.         从数据结构方面来说:                数组:最简单,遍历.查找很快:但是大小固定,不利于扩展 ...

随机推荐

  1. Php7有哪些新特性:

    PHP7在PHP5的基础上又做了一次质的提升,当然改变很多,我这里以我的总结简单说下,主要发生了下面这些更改: 移除了一些旧的特性 ZEND引擎升级到Zend Engine 3,也就是所谓的PHP N ...

  2. asp.net core 缓存和Session

    缓存 缓存在内存中 ASP.NET Core 使用 IMemoryCache内存中缓存是使用依赖关系注入从应用中引用的服务. 请在ConfigureServices中调用AddMemoryCache( ...

  3. error: <item> inner element must either be a resource reference or empty.

    FAQ: Android resource compilation failedOutput: /home/cmm/code/AndroidHttpCapture/app/build/intermed ...

  4. 各厂商服务器存储默认管理口登录信息(默认IP、用户名、密码)收集

    666:https://blog.csdn.net/xiezuoyong/article/details/84997917

  5. noip2017逛公园

    题解: 之前知道正解并没有写过.. #include <bits/stdc++.h> using namespace std; #define rint register int #def ...

  6. P4715 「英语」Z 语言

    题解: 平衡树维护hash值 为了支持加入删除操作 x*base^y 其中y为他是第k大 同一般的维护方法,我们不用对每个节点维护他的hash值 而是只用记录他的x值(他的位置) 然后通过updata ...

  7. Python Web开发问题收集(二)

  8. Python--os的常见方法

    1.os.getcwd()+'/filename'------>相当于在当前运行文件的目录下创建一个以filename命名的文件 2.os.path.realpath(__file__)---- ...

  9. Kafka Manager

    1.kafka Manager 1.上传压缩包kafka-manager-1.3.3.15.zip到集群 2.解压到/opt/module 3.修改配置文件conf/application.conf ...

  10. Codeforces 1105C Ayoub and Lost Array (计数DP)

    <题目链接> 题目大意: 有一个长度为 n 的数列的未知数列,数列的每一个数的值都在区间 [l,r]  的范围内.现在问你能够构成多少个这样的数组,使得数组内的所有数的和能够被 3 整除. ...