后缀数组

代码

void rsort() {
for (int i = 1; i <= m; ++i) tax[i] = 0;
for (int i = 1; i <= n; ++i) ++tax[rnk[i]];
for (int i = 1; i <= m; ++i) tax[i] += tax[i-1];
for (int i = n; i >= 1; --i) sa[tax[rnk[tmp[i]]]--] = tmp[i];
} void ssort() {
for (int i = 1; i <= n; ++i) rnk[i] = a[i], tmp[i] = i;
m = 127;
rsort();
for (int w = 1, p = 0; p < n; w <<= 1) {
p = 0;
for (int i = 1; i <= w; ++i) tmp[++p] = n - w + i;
for (int i = 1; i <= n; ++i) if (sa[i] > w) tmp[++p] = sa[i] - w;
rsort();
std::swap(rnk, tmp);
rnk[sa[1]] = p = 1;
for (int i = 2; i <= n; ++i) {
rnk[sa[i]] = (tmp[sa[i]] == tmp[sa[i-1]]
&& tmp[sa[i]+w] == tmp[sa[i-1]+w]) ? p : ++p;
}
m = p;
}
for (int i = 1, k = 0; i <= n; ++i) {
while (a[i+k] == a[sa[rnk[i]-1]+k]) ++k;
h[rnk[i]] = k;
if (k) --k;
}
}

应用

关于后缀数组和后缀自动机,在hihocoder上有一套很好的题(重复旋律)。

最长可重叠重复K次子串问题

(hiho1403)

h数组中长度为k的子串的最小值的最大值。

最长不可重叠重复子串问题

(hiho1407)

二分答案为k,若h数组中有连续的一段大于k的值(即有一个子串重复了),且这一段中最靠前的位置和最靠后的位置之间的差大于k(即这个子串可以不重叠),那么该答案合法。

bool check(int x) {
int mn = N + 10, mx = 0;
for (int i = 1, flag = 0; i <= n; ++i) {
if (h[i] >= x) {
if (!flag) { // mark
mx = std::max(mx, sa[i-1]);
mn = std::min(mn, sa[i-1]);
}
mx = std::max(mx, sa[i]);
mn = std::min(mn, sa[i]);
flag = 1;
} else if (flag) {
flag = 0;
if (mx - mn >= x) {
return true;
}
mn = N + 10;
mx = 0;
}
}
return false;
}

注意由于h数组的定义,我们需要标记为mark的部分。

最长公共子串问题

(hiho1415)

将两个子串拼接起来,用'#'分隔,那么两个串的最长公共子串就是保证sa[i]sa[i-1]不在同一个串内的最大的h[i]

连续重复次数最多的子串

(hiho1419)

枚举子串长度l和重复起点p,计算重复次数lcp(p, p+l)/l + 1,复杂度\(O(n^2)\)。

考虑优化,我们可以以l的间隔枚举p,考虑某个位置p,记lcp(p, p+l)R,那么,被我们忽略掉的位置p-1,p-2,p-3...的答案值不会超过R+1

对于\(p-R\bmod l < x < p\) 的\(x\),以x为起点的答案值不可能超过R(由公式易得),而对于\(p-l<x<p-R\bmod l\)的\(x\),以x为起点的答案值也不可能超过以p-R%l的答案值,所以只需计算成倍的pp-R%l的答案值即可。

for (int l = 1; l <= n; ++l) {
for (int i = 1; i+l <= n; i += l) {
int R = lcp(i, i + l);
ans = std::max(ans, R / l + 1);
if (i >= l - R%l) {
ans = std::max(ans,
lcp(i - l + R%l, i + R%l) / l + 1);
}
}
}

不同子串的数目问题

\(\frac{1}{2}n(n+1)-\sum_{i=1}^n h[i]\)

[Note]后缀数组的更多相关文章

  1. POJ1743 Musical Theme [后缀数组]

    Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 27539   Accepted: 9290 De ...

  2. HDU5008 Boring String Problem(后缀数组 + 二分 + 线段树)

    题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=5008 Description In this problem, you are given ...

  3. 后缀数组---Musical Theme

    POJ   1743 Description A musical melody is represented as a sequence of N (1<=N<=20000)notes t ...

  4. POJ 1743 Musical Theme (后缀数组,求最长不重叠重复子串)(转)

    永恒的大牛,kuangbin,膜拜一下,Orz 链接:http://www.cnblogs.com/kuangbin/archive/2013/04/23/3039313.html Musical T ...

  5. POJ 1743 Musical Theme 后缀数组 最长重复不相交子串

    Musical ThemeTime Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://poj.org/problem?id=1743 Description ...

  6. hdu 5442 Favorite Donut 后缀数组

    Favorite Donut Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://acm.hdu.edu.cn/showproblem.php?pid ...

  7. poj 1743 男人八题之后缀数组求最长不可重叠最长重复子串

    Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 14874   Accepted: 5118 De ...

  8. POJ1743---Musical Theme(+后缀数组二分法)

    Description A musical melody is represented as a sequence of N (1<=N<=20000)notes that are int ...

  9. POJ1743 Musical Theme [后缀数组+分组/并查集]

    Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 27539   Accepted: 9290 De ...

随机推荐

  1. hdu 2187 悼念512汶川大地震遇难同胞——老人是真饿了(贪心)

    新人题:n2的排序就可以过 #include <stdio.h> #include <stdlib.h> int main() { int c,n,i,j,o; ],b[],m ...

  2. CentOS虚拟机挂载U盘

    参考:https://www.cnblogs.com/jizhong/p/9410659.html 1.检查VMUSBArbService服务是否正在运行 2.在VMWare中连接插入的U盘 3.使用 ...

  3. Cloud插件,链接oracle数据库

    业务场景:客户需要在Cloud中获取第三方系统的数据,但是第三方系统的数据库是oracle,这是就需要连接oracle数据库获取数据了. 需要引用Oracle.ManagedDataAccess.dl ...

  4. php函数的巧妙应用

    直接切入正题: 1.extract();函数从数组中把变量导入到当前的符号表中 对于数组中的每个元素,键名用于变量名,键值用于变量值. 第二个参数 type 用于指定当某个变量已经存在,而数组中又有同 ...

  5. linux 搭建python虚拟环境

    requirements.txt 包含paramiko,pysfp.setuptools,适用python版本3.6.6+ 前提编译安装python wget wget https://www.pyt ...

  6. 2019-08-21 纪中NOIP模拟A组

    T1 [JZOJ6315] 数字 题目描述

  7. data_analysis 第一课

    1.anaconda的安装与使用 在官网下载anaconda的客户端,因为python有2和3之分,所以有两个版本可以供选择,由于该课程使用2作为开发工具,选择anaconda2下载安装. 安装好之后 ...

  8. pytest-fixture之conftest.py

    场景: 对于一个py文件中某些用例需要前置条件,某些用例不需要前置条件的情况,使用setup/teardown肯定是不方便的, 这时就需要自定义测试用例的前置条件. 1.fixture优点: 命名不局 ...

  9. 10.3 c++ STL 初步

    #include<Windows.h>#include<iostream>#include<algorithm>  // sort  swap   min   ma ...

  10. 使用VSCode创建简单的Razor Webapp--2.添加模型

    1.新建Models文件夹,并新建Movie.cs文件 using System; using System.ComponentModel.DataAnnotations; namespace Raz ...