exkmp 用于求解这样的问题:

求文本串 \(T\) 的每一个后缀与模式串 \(M\) 的匹配长度(即最长公共前缀长度)。特别的,取 \(M=T\),得到的这个长度被称为 \(Z\) 函数。“函数”只是一个叫法,它本质上是个数组...为了好听,后面叫他“\(Z\) 数组” (互联网上的确有人这么叫)

符号(字符串)

\(|S|\) 表示 \(S\) 的长度

\(S[l:r]\) 表示 \(S\) 从 \(l\) 到 \(r\) 的子串。如果 \(l\) 空着,默认为 \(1\);同理 \(r\) 默认为 \(|S|\)。

也就是 \(S[:x]\) 表示 \(S\) 到 \(x\) 结束的前缀,\(S[x:]\) 表示 \(S\) 从 \(x\) 开始的后缀。

\(LCP(S_1,S_2)\) 表示 \(S_1,S_2\) 的 最长公共前缀Longest Common Prefix

算法讲解

设 \(p_i=LCP(T_i,M)\)

定义从 \(l\) 开始的匹配区间为 \([l,l+p_l-1]\) (设 \(l+p_l-1=r\))

我们枚举处理。假设现在已经求好了 \([1,i-1]\) 的 \(p\) 数组,要求 \(p_i\)。记录一个 最靠后 的匹配区间 \([l,r]\) (\(l<i\),以 \(r\) 靠后为第一关键字,\(l\) 靠后为第二关键字),考虑直接从 \([l,r]\) 中继承点答案来,那很显然一个前提就是 \(i\le r\) (你 \(i\) 在 \(r\) 外面继承啥)

显然,\(p_i\ge LCP(T[i:r],M)\) (因为 \(T[i:r]\) 是 \(T[i:]\) 前缀)

由定义, \([l,r]\) 是最长匹配长度,可知 \(T[l:r]=M[1:r-l+1]\)。

然后现在假如 \(l<i\le r\),那么显然 \(T[i:r]=M[i-l+1:r-l+1]\)

那么 \(LCP(T[i:r],M)=LCP(M[i-l+1:r-l+1],M)\)

简单想一下,\(LCP(A[l:r],A)=min(LCP(A[l:],A),r-l+1)\)

我们要求 \([l,r]\) 子串与整个串的 \(LCP\),可以先求以 \(l\) 开头的整个后缀的与整个串的 \(LCP\),然后和区间长度取 \(min\)。这显然正确。

然后有:

\(LCP(M[i-l+1:r-l+1],M)=min(LCP(M[i-l+1:],M),(r-l+1)-(i-l+1+1))\)

右边的 \(-l+1\) 两个抵消了,就变成 \(r-i+1\)

然后前面是 \(LCP(M[i-l+1:],M)\) 。这不就是 \(M\) 的 \(Z\) 数组的第 \(i-l+1\) 个位置吗!(还记得 \(Z\) 数组的定义吗?)

觉得看字母理解不了的看图(自己画的)(纯鼠标):

红色的部分就是我们推出来的匹配部分。然后现在我们把 \(M\) 移到 \(i\) 开头的位置来匹配,就相当于把 \(M[i-l+1:r-l+1]\) 这一段(红色)移到 \(M\) 的开头处匹配。这一段匹配的长度就是 \(min(Z_{i-l+1},r-i+1)\)。

假设我们现在能求这个 \(Z\) 数组,那么我们已经知道 \(p_i\) 的最小值了 ,就是 \(min(Z_{i-l+1},r-i+1)\) 。从这个位置开始暴力即可。这样就不用每次从 \(1\) 开始匹配了。

求完 \(p_i\) 之后,记得用 \([i,i+p_i-1]\) 更新 \([l,r]\)。

update 2021.01.20:

时间是线性的。原因是,每次成功匹配之后,能直接继承答案的区间便多了一位,复杂度便是线性的。

证明由神仙学长 tzxydby 提供

如何求 Z 数组

我们发现 \(Z\) 数组就是自己和自己匹配的过程。然后我们把上面过程中 \(M\) 换成 \(T\) 即可。

所以我们还是记录一个最靠后的匹配区间 \([l,r]\),然后 \(p_i\) 就相当于 \(Z_i\) 了。

易得:

\(Z_i=min(LCP(M[i-l+1:],M),r-i+1)=min(LCP(T[i-l+1:],T),r-i+1)=min(Z_{i-l+1},r-i+1)\)

求完 \(Z_i\) 之后,记得用 \([i,i+Z_i-1]\) 来更新 \([l,r]\)。

一样,也是从这里开始暴力即可。同理,时间复杂度依然是线性的。

模板

洛谷板子

#include <bits/stdc++.h>
using namespace std;
#define N 20000007
#define F(i,l,r) for(int i=l;i<=r;++i)
#define D(i,r,l) for(int i=r;i>=l;--i)
#define Fs(i,l,r,c) for(int i=l;i<=r;c)
#define Ds(i,r,l,c) for(int i=r;i>=l;c)
#define MEM(x,a) memset(x,a,sizeof(x))
#define FK(x) MEM(x,0)
#define Tra(i,u) for(int i=G.Start(u),v=G.To(i);~i;i=G.Next(i),v=G.To(i))
#define p_b push_back
#define sz(a) ((int)a.size())
#define all(a) a.begin(),a.end()
#define iter(a,p) (a.begin()+p)
#define Flandre_Scarlet int
#define IsMyWife main
char _c;
int I()
{
int x=0; int f=1;
while(_c<'0' or _c>'9') f=(_c=='-')?-1:1,_c=getchar();
while(_c>='0' and _c<='9') x=(x<<1)+(x<<3)+(_c^48),_c=getchar();
return (x=(f==1)?x:-x);
}
void Rd(int cnt,...)
{
va_list args; va_start(args,cnt);
F(i,1,cnt) {int* x=va_arg(args,int*);(*x)=I();}
va_end(args);
} char a[N],b[N];
void Input()
{
scanf("%s%s",a+1,b+1);
}
int z[N];
void Z(char s[]) // 求 Z 函数
{
int n=strlen(s+1);
z[1]=n; F(i,2,n) z[i]=0;
// Z[1]=n 特判,同时也是递推边界
int l=0,r=0;
F(i,2,n)
{
if (i<=r) z[i]=min(z[i-l+1],r-i+1); // 推理出下界
while(i+z[i]<=n and s[i+z[i]]==s[z[i]+1]) ++z[i]; // 暴力
if (i+z[i]-1>=r) l=i,r=i+z[i]-1; // 更新最靠后的匹配位置
}
}
int p[N];
void ExKmp(char s[],char t[])
{
int n=strlen(s+1);
Z(t);
int l=0,r=0;
F(i,1,n)
{
if (i<=r) p[i]=min(z[i-l+1],r-i+1); // 推理出下界
while(i+p[i]<=n and s[i+p[i]]==t[p[i]+1]) ++p[i]; // 暴力
if (i+p[i]-1>r) l=i,r=i+p[i]-1; // 更新最靠后的匹配位置
}
}
void Soviet()
{
ExKmp(a,b);
int n=strlen(a+1),m=strlen(b+1);
long long ans=0;
F(i,1,m) ans^=1ll*i*(z[i]+1);
printf("%lld\n",ans);
ans=0;
F(i,1,n) ans^=1ll*i*(p[i]+1);
printf("%lld\n",ans);
}
Flandre_Scarlet IsMyWife()
{
Input();
Soviet();
getchar();
return 0;
}

exkmp(Z函数) 笔记的更多相关文章

  1. luogu P5410 模板 扩展 KMP Z函数 模板

    LINK:P5410 模板 扩展 KMP Z 函数 画了10min学习了一下. 不算很难 思想就是利用前面的最长匹配来更新后面的东西. 复杂度是线性的 如果不要求线性可能直接上SA更舒服一点? 不管了 ...

  2. MySQL函数笔记

    MySQL函数笔记 日期函数 SELECT t1.xcjyrq, t1.* FROM view_sbxx t1 WHERE t1.syzt ; SELECT t1.xcjyrq, t1.* FROM ...

  3. JavaScript基础——JavaScript函数(笔记)

    avaScript 函数(笔记) JavaScript 是函数式编程语言,在JavaScript脚本中可以随处看到函数,函数构成了JavaScript源代码的主体. 一.定义函数 定义函数的方法有两种 ...

  4. STL之vector常用函数笔记

    STL之vector常用函数笔记 学会一些常用的vector就足够去刷acm的题了 ps:for(auto x:b) cout<<x<<" ";是基于范围的 ...

  5. numpy函数笔记(持续更新)

    numpy函数笔记 np.isin用法 np.isin(a,b) 用于判定a中的元素在b中是否出现过,如果出现过返回True,否则返回False,最终结果为一个形状和a一模一样的数组.(注意:这里的a ...

  6. 题解-洛谷P5410 【模板】扩展 KMP(Z 函数)

    题面 洛谷P5410 [模板]扩展 KMP(Z 函数) 给定两个字符串 \(a,b\),要求出两个数组:\(b\) 的 \(z\) 函数数组 \(z\).\(b\) 与 \(a\) 的每一个后缀的 L ...

  7. Atcoder Regular Contest 058 D - 文字列大好きいろはちゃん / Iroha Loves Strings(单调栈+Z 函数)

    洛谷题面传送门 & Atcoder 题面传送门 神仙题. mol 一发现场(bushi)独立切掉此题的 ycx %%%%%%% 首先咱们可以想到一个非常 naive 的 DP,\(dp_{i, ...

  8. 前缀函数与Z函数介绍

    字符串算法果然玄学=_= 参考资料: OI Wiki:前缀函数与KMP算法 OI Wiki:Z函数(扩展KMP) 0. 约定 字符串的下标从 \(0\) 开始.\(|s|\) 表示字符串 \(s\) ...

  9. KMP&Z函数详解

    KMP 一些简单的定义: 真前缀:不是整个字符串的前缀 真后缀:不是整个字符串的后缀 当然不可能这么简单的,来个重要的定义 前缀函数: 给定一个长度为\(n\)的字符串\(s\),其 \(前缀函数\) ...

随机推荐

  1. 搭建 Typecho 个人博客

    搭建 Typecho 个人博客 前言 最近在学习中,感觉有个自己的博客,用来记录学习总结,写写生活点滴是件不错的事. 在网上看到 Typecho 博客和 WordPress博客,顿时被 Typecho ...

  2. volatile 关键字精讲

    1.错误案例 通过一个案例引出volatile关键字,例如以下代码示例 : 此时没有加volatile关键字两个线程间的通讯就会有问题 public class ThreadsShare { priv ...

  3. Linux下安装svn教程

    前言 最近买了新服务器,准备开始弄一些个人的开源项目.有了服务器当然是搞一波svn啦.方便自己的资料上传和下载.于是在此记录搭建svn的方式,方便以后直接使用. 安装 使用yum源进行安装,十分的方便 ...

  4. Django中一种常见的setting与账密保存/读取方式

    前言 在查看别人Django代码的时候,发现很多的manager文件都是类似于 #!/usr/bin/env python import os import sys if __name__ == '_ ...

  5. Java远程下载文件到本地(http协议和ssh2协议)

    Java中java.io包为我们提供了输入流和输出流,对文件的读写基本上都依赖于这些封装好的关于流的类中来实现.前段时间遇到了以下两种需求: 1.与某系统对接,每天获取最新的图片并显示在前端页面.该系 ...

  6. SQL查找连续出现的数字

    基于Oracle: 题:编写一个 SQL 查询,查找所有至少连续出现三次的数字. +----+-----+ | Id | Num | +----+-----+ | 1 | 1 | | 2 | 1 | ...

  7. leetcode 470. 用 Rand7() 实现 Rand10() (数学,优化策略)

    题目链接 https://leetcode-cn.com/problems/implement-rand10-using-rand7/ 题意: 给定一个rand7()的生成器,求解如何产生一个rand ...

  8. Leetcode53. 最大子序列和

    问题 给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和. 代码 贪心算法 核心思想就是检查之前 i-1 的元素和,如果小于零就舍弃--对应下面第六行 ...

  9. 这难道不是.NET5 的bug? 在线求锤?

    hello,最近在对一个使用.NET5项目的认证授权系统进行重构,对.NET 5的授权中间件的源码有些看法. 也希望同学们能帮我理解. 一个朴素的需求 这是一个api项目,默认所有的api都需要授权, ...

  10. SAP中使用FTP服务

    SAP中简单的FTP技术实现基本上如下几个步骤: 1.SM59建立FTP的RFC destination. 可以通过执行SAP的标准程序RSFTP005,自动创建两个名为SAPFTP何SAPFTPA的 ...