Gym - 101194F(后缀数组)
Mr. Panda and Fantastic Beasts
题意
给出若干个字符串,找到一个最短的字典序最小的字符串且仅是第一个字符串的子串。
分析
对于这种多个字符串、重复的子串问题一般都要连接字符串加后缀数组解决(当然也存在其它方法)。
用一个未出现的字符连接多个字符串,计算出后缀数组,枚举 \(sa\) 数组(\(sa\) 数组是按字典序排序的,保证我们选到的相同长度的子串一定是字典序最小的)。
如果枚举到的 \(sa\) 的首字母都属于第一个字符串,那么全部存起来,直到遇到其它字符串,我们用前面存起来的的值分别与前面最近的、后面最近的首字母不在第一个字符串的后缀串计算 \(LCP1, LCP2\) (这个可以用 \(ST\) 算法预处理),那么长度至少为是 \(max\{LCP1, LCP2\} + 1\),但是必须保证加上首字母的下标不超过第一个字符串的长度。
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<cmath>
typedef long long ll;
using namespace std;
const int MAXN = 5e5 + 10;
const int INF = 1e8;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,即最后一位为数字 0
int rnk[MAXN], height[MAXN];
// 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
void build_sa(int m) {
int i, *x = t, *y = t2;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = s[i]]++;
for(i = 1; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for(int k = 1; k <= n; k <<= 1) {
int p = 0;
for(i = n - k; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 0; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
if(p >= n) break;
m = p;
}
}
void getHeight() {
int i, j, k = 0;
for(i = 0; i < n; i++) rnk[sa[i]] = i;
for(i = 0; i < n - 1; i++) {
if(k) k--;
j = sa[rnk[i] - 1];
while(s[i + k] == s[j + k]) k++;
height[rnk[i]] = k;
}
}
int T, kase = 1;
char s2[MAXN];
int q[MAXN];
int dp[MAXN][30];
void init() {
for(int i = 0; i < n; i++) {
dp[i][0] = height[i];
}
for(int i = 1; (1 << i) < MAXN; i++) {
for(int j = 0; j < n; j++) {
dp[j][i] = min(dp[j][i - 1], dp[j + (1 << (i - 1))][i - 1]);
}
}
}
int query(int l, int r) {
if(l > r) swap(l, r);
l++;
int k = (int)(log((double)r - l + 1) / log(2.0));
return min(dp[l][k], dp[r - (1 << k) + 1][k]);
}
int main() {
scanf("%d", &T);
while(T--) {
int m;
scanf("%d", &m);
scanf("%s", s);
int L = strlen(s);
int k = L;
s[L++] = '$';
for(int i = 1; i < m; i++) {
scanf("%s", s2);
int l = strlen(s2);
for(int j = L; j < L + l; j++) {
s[j] = s2[j - L];
}
L += l;
s[L++] = '$';
}
s[L] = 0;
n = L + 1;
build_sa(128);
getHeight();
init();
int p = -1, len = 0, cnt = 0, pre = -1;
if(sa[1] < k) q[cnt++] = sa[1];
else pre = sa[1];
for(int i = 2; i < n; i++) {
while(i < n && sa[i] < k) {
q[cnt++] = sa[i];
i++;
}
if(i == n) break;
for(int j = 0; j < cnt; j++) {
int tmp1;
if((tmp1 = query(rnk[q[j]], rnk[sa[i]])) + q[j] < k) {
int tmp2;
if(pre != -1 && (tmp2 = query(rnk[q[j]], rnk[pre])) + q[j] < k) {
int tlen = max(tmp1, tmp2) + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
if(pre == -1) {
int tlen = tmp1 + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
}
}
cnt = 0;
if(sa[i] >= k) pre = sa[i];
}
for(int i = 0; i < cnt; i++) {
int tmp1;
if(pre != -1 && (tmp1 = query(rnk[q[i]], rnk[pre])) + q[i] < k) {
int tlen = tmp1 + 1;
if((q[i] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[i];
len = tlen;
}
}
}
printf("Case #%d: ", kase++);
if(p == -1) puts("Impossible");
else {
for(int i = p; i < p + len; i++) printf("%c", s[i]);
printf("\n");
}
}
return 0;
}
Gym - 101194F(后缀数组)的更多相关文章
- Gym - 102028H Can You Solve the Harder Problem? (后缀数组+RMQ+单调栈)
题意:求一个序列中本质不同的连续子序列的最大值之和. 由于要求“本质不同”,所以后缀数组就派上用场了,可以从小到大枚举每个后缀,对于每个sa[i],从sa[i]+ht[i]开始枚举(ht[0]=0), ...
- 回文树&后缀自动机&后缀数组
KMP,扩展KMP和Manacher就不写了,感觉没多大意思. 之前感觉后缀自动机简直可以解决一切,所以不怎么写后缀数组. 马拉车主要是通过对称中心解决问题,有的时候要通过回文串的边界解决问题 ...
- 2018 - 2019 CTU Open Contest E. Locker Room 【后缀数组】
任意门:http://codeforces.com/gym/101954/problem/E E. Locker Room time limit per test 2.0 s memory limit ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- linux运维笔记
一.查找大文件 sudo find / -size +100M -exec ls -lh {} \;
- 四 Android Capabilities讲解
本文转自:http://www.cnblogs.com/sundalian/p/5629429.html Android Capabilities讲解 1.Capabilities介绍 可以看下之 ...
- JS——BOM、DOM
BOM.DOM BOM window对象 history对象 location对象 screen对象 DOM DOM对HTML元素访问操作 HTML DOM树 DOM 节点 DOM访问HTML元素 D ...
- Python利器一之requests
Python利器一之requests 一.教程涉及开发语言.脚本.框架.数据库等内容 Python + requests 通过 pip 安装: pip install requests 通过 easy ...
- 利用jsoup抓取网页图片
jsoup简介 jsoup is a Java library for working with real-world HTML. It provides a very convenient API ...
- Linux系统源码安装cloud-init
参考:https://cloud.tencent.com/document/product/213/12587使用以下命令下载 cloud-init 源码包 官网下载地址:https://launch ...
- linux备忘录-vi和vim
知识点 vi的三种模式 一般模式 按 ESC 可回到一般模式 相关按键 j 代表 向下按钮 k 代表 向上按钮 h 代表 向左按钮 l 代表 向右按钮 20j 等代表 向下移动20行 Ctrl + f ...
- HDU 4750 Count The Pairs (离线并查集)
按边从小到大排序. 对于每条边(from, to, dist),如果from和to在同一个集合中,那么这条边无意义,因为之前肯定有比它更小的边连接了from和to. 如果from和to不属于同一个集合 ...
- jquery serialize() 方法
ajax异步提交的时候,会使用该方法. 方法:jQuery ajax - serialize() 方法
- HTML5_纯JS实现上传文件显示文件大小,文件信息,上传进度_不使用JS库
前台 html <input type="file" id="_netLogo" onchange="fileSelected();" ...