Gym - 101194F(后缀数组)
Mr. Panda and Fantastic Beasts
题意
给出若干个字符串,找到一个最短的字典序最小的字符串且仅是第一个字符串的子串。
分析
对于这种多个字符串、重复的子串问题一般都要连接字符串加后缀数组解决(当然也存在其它方法)。
用一个未出现的字符连接多个字符串,计算出后缀数组,枚举 \(sa\) 数组(\(sa\) 数组是按字典序排序的,保证我们选到的相同长度的子串一定是字典序最小的)。
如果枚举到的 \(sa\) 的首字母都属于第一个字符串,那么全部存起来,直到遇到其它字符串,我们用前面存起来的的值分别与前面最近的、后面最近的首字母不在第一个字符串的后缀串计算 \(LCP1, LCP2\) (这个可以用 \(ST\) 算法预处理),那么长度至少为是 \(max\{LCP1, LCP2\} + 1\),但是必须保证加上首字母的下标不超过第一个字符串的长度。
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<cmath>
typedef long long ll;
using namespace std;
const int MAXN = 5e5 + 10;
const int INF = 1e8;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,即最后一位为数字 0
int rnk[MAXN], height[MAXN];
// 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
void build_sa(int m) {
int i, *x = t, *y = t2;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = s[i]]++;
for(i = 1; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for(int k = 1; k <= n; k <<= 1) {
int p = 0;
for(i = n - k; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 0; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
if(p >= n) break;
m = p;
}
}
void getHeight() {
int i, j, k = 0;
for(i = 0; i < n; i++) rnk[sa[i]] = i;
for(i = 0; i < n - 1; i++) {
if(k) k--;
j = sa[rnk[i] - 1];
while(s[i + k] == s[j + k]) k++;
height[rnk[i]] = k;
}
}
int T, kase = 1;
char s2[MAXN];
int q[MAXN];
int dp[MAXN][30];
void init() {
for(int i = 0; i < n; i++) {
dp[i][0] = height[i];
}
for(int i = 1; (1 << i) < MAXN; i++) {
for(int j = 0; j < n; j++) {
dp[j][i] = min(dp[j][i - 1], dp[j + (1 << (i - 1))][i - 1]);
}
}
}
int query(int l, int r) {
if(l > r) swap(l, r);
l++;
int k = (int)(log((double)r - l + 1) / log(2.0));
return min(dp[l][k], dp[r - (1 << k) + 1][k]);
}
int main() {
scanf("%d", &T);
while(T--) {
int m;
scanf("%d", &m);
scanf("%s", s);
int L = strlen(s);
int k = L;
s[L++] = '$';
for(int i = 1; i < m; i++) {
scanf("%s", s2);
int l = strlen(s2);
for(int j = L; j < L + l; j++) {
s[j] = s2[j - L];
}
L += l;
s[L++] = '$';
}
s[L] = 0;
n = L + 1;
build_sa(128);
getHeight();
init();
int p = -1, len = 0, cnt = 0, pre = -1;
if(sa[1] < k) q[cnt++] = sa[1];
else pre = sa[1];
for(int i = 2; i < n; i++) {
while(i < n && sa[i] < k) {
q[cnt++] = sa[i];
i++;
}
if(i == n) break;
for(int j = 0; j < cnt; j++) {
int tmp1;
if((tmp1 = query(rnk[q[j]], rnk[sa[i]])) + q[j] < k) {
int tmp2;
if(pre != -1 && (tmp2 = query(rnk[q[j]], rnk[pre])) + q[j] < k) {
int tlen = max(tmp1, tmp2) + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
if(pre == -1) {
int tlen = tmp1 + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
}
}
cnt = 0;
if(sa[i] >= k) pre = sa[i];
}
for(int i = 0; i < cnt; i++) {
int tmp1;
if(pre != -1 && (tmp1 = query(rnk[q[i]], rnk[pre])) + q[i] < k) {
int tlen = tmp1 + 1;
if((q[i] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[i];
len = tlen;
}
}
}
printf("Case #%d: ", kase++);
if(p == -1) puts("Impossible");
else {
for(int i = p; i < p + len; i++) printf("%c", s[i]);
printf("\n");
}
}
return 0;
}
Gym - 101194F(后缀数组)的更多相关文章
- Gym - 102028H Can You Solve the Harder Problem? (后缀数组+RMQ+单调栈)
题意:求一个序列中本质不同的连续子序列的最大值之和. 由于要求“本质不同”,所以后缀数组就派上用场了,可以从小到大枚举每个后缀,对于每个sa[i],从sa[i]+ht[i]开始枚举(ht[0]=0), ...
- 回文树&后缀自动机&后缀数组
KMP,扩展KMP和Manacher就不写了,感觉没多大意思. 之前感觉后缀自动机简直可以解决一切,所以不怎么写后缀数组. 马拉车主要是通过对称中心解决问题,有的时候要通过回文串的边界解决问题 ...
- 2018 - 2019 CTU Open Contest E. Locker Room 【后缀数组】
任意门:http://codeforces.com/gym/101954/problem/E E. Locker Room time limit per test 2.0 s memory limit ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- [转]如何像Python高手(Pythonista)一样编程
本文转自:http://xianglong.me/article/how-to-code-like-a-pythonista-idiomatic-python 最近在网上看到一篇介绍Pythonic编 ...
- [转载]kd tree
[本文转自]http://www.cnblogs.com/eyeszjwang/articles/2429382.html k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据 ...
- 上手Caffe(一)
@author:oneBite 本文记录编译使用caffe for windows 使用环境 VS2013 ultimate,win7 sp1,caffe-windows源码(从github上下载ca ...
- stack,heap的区别
一个由C/C++编译的程序占用的内存分为以下几个部分 1.栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等.其 操作方式类似于数据结构中的栈. ...
- 【bzoj1565】[NOI2009]植物大战僵尸 拓扑排序+最大权闭合图
原文地址:http://www.cnblogs.com/GXZlegend/p/6808268.html 题目描述 输入 输出 仅包含一个整数,表示可以获得的最大能源收入.注意,你也可以选择不进行任何 ...
- POJ 3421 X-factor Chains | 数论
题意: 给一个x,求最长的排列满足开头是1,结尾是x,前一个数是后一个数的因子 输出长度和这样序列的个数 题解: 把x分解质因数,质因数个数就是答案,接下来考虑怎么求个数 显然这是一个可重集合全排列问 ...
- 太空飞船(spaceship)
太空飞船(spaceship) 题目描述 21XX年,秋. 小诚是THU(Tomorrow Happy University)航天学院船舶设计系本科四年级的学生.为了顺利毕业,小诚仔细阅读了这几年被引 ...
- CSU 2031
2031: Barareh on Fire Submit Page Summary Time Limit: 3 Sec Memory Limit: 512 Mb Submitt ...
- mysql 查询结果创建表
用 SELECT 的结果创建表 关系数据库的一个重要概念是,任何数据都表示为行和列组成的表,而每条 SELECT 语句的结果也都是一个行和列组成的表.在许多情况下,来自 SELECT 的“表”仅是一个 ...
- .com和.cn域名的区别所在,各个域名后缀含义
很多人在注册域名的时候不明白域名后缀的含义,在这里就介绍两种最为常用的域名,介绍下他们的区别以及适用的范围.需要先查询是否被注册,我们经常去的就是西部数据和万网,查询并注册未被注册的域名,一般无论是什 ...