【BZOJ 3998】弦论
【链接】h在这里写链接
【题意】
让你求出第k小的子串是什么;
输出答案的类型分两种;
第一种,重复的算两次,第二种,重复的算一次。
你的程序要能分别处理这两种情况。
n最大5*10^5
【题解】
先求出后缀数组;
然后按照后缀的大小升序枚举每一个后缀就好。
对于重复算作一个的情况,则用每一个后缀的长度减去Height[i];
这个被减过的值就是以i开头的子串,且不和之前出现过的重复的子串的个数了。
->也即算出来字典序为k的子串是多少。
对于重复算作多个的情况。感觉反而不好写。。
这样做.
先把排名前i的后缀的所有的子串的个数算出来,->做一个前缀和
便于后续的操作。
然后,对于最后的子串的每一位,
枚举它应该为多少
->一个类似数位DP的做法。
假如最后的子串的第一位是'c'
那么
形如
axxxxxxx
bxxxxxxx
的后缀,都能够把它删掉了。
也即把所有小于它的子串全都减掉。
直到
'j'xxxxx的子串个数>=k为止。
这样就能确定第一位是j.
然后再枚举第二位是什么也从'a'..'z'
直到能够确定每一位是什么为止。
我们可以用二分+Sa来快速确定第i位是j的后缀有多少个。
再用一开始处理好的前缀和。
就能知道第i位是j的后缀,包含的子串个数。
(一开始二分的范围是1..n)
(这个范围表示的是后缀排名为1..n)
(之后我们会逐渐缩小这个二分的范围)
(左端点会逐渐变大..)
(一旦确定第一位是某个字符之后,二分排名的范围就都会变小了..
因为【第一位是某个字符的后缀】是【集中在一片区域里面】的,同理第二位也确定
了之后,这个范围【又会变小】了。)
(所以二分的时候,这片区域的后缀的前i-1位全都是相同的)
从小到大枚举,逐渐确定每一位字符。
具体实验看程序吧
【错的次数】
【反思】
【代码】
#include<bits/stdc++.h>
#define ll long long
using namespace std; const int N = 5e5;
const int MAX_CHAR = 255;//每个数字的最大值。
char s[N + 10];//如果是数字,就写成int s[N+10]就好,从0开始存
int Sa[N + 10], T1[N + 10], T2[N + 10], C[N + 10];
int Height[N + 10], Rank[N + 10]; void build_Sa(int n, int m) {
int i, *x = T1, *y = T2;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[i] = s[i]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[i]]] = i;
for (int k = 1; k <= n; k <<= 1)
{
int p = 0;
for (i = n - k; i<n; i++) y[p++] = i;
for (i = 0; i<n; i++) if (Sa[i] >= k) y[p++] = Sa[i] - k;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[y[i]]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[Sa[0]] = 0;
for (i = 1; i<n; i++)
x[Sa[i]] = y[Sa[i - 1]] == y[Sa[i]] && y[Sa[i - 1] + k] == y[Sa[i] + k] ? p - 1 : p++;
if (p >= n) break;
m = p;
}
} void getHeight(int n)
{
int i, j, k = 0;
for (i = 1; i <= n; i++) Rank[Sa[i]] = i;
for (i = 0; i<n; i++) {
if (k) k--;
j = Sa[Rank[i] - 1];
while (s[i + k] == s[j + k]) k++;
Height[Rank[i]] = k;
}
} ll k, sum[N + 10];
int T, n; void print(int x, int y)
{
for (int i = x; i <= y; i++)
putchar(s[i]);
} int main() {
//freopen("F:\\rush.txt", "r", stdin);
scanf("%s", s);
scanf("%d%lld", &T, &k);
n = strlen(s);
s[n] = 0;
build_Sa(n + 1, MAX_CHAR);//注意调用n+1
getHeight(n);
if (T == 0)
{
ll ans = 0;
for (int i = 1; i <= n; i++)
{
int t = n - Sa[i] - Height[i];
if (k <= t)
return print(Sa[i], (int)k + Sa[i] + Height[i] - 1), 0;
k -= t;
}
}
else
{
sum[0] = 0;
for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] + n - Sa[i];
//sum[i]表示排名第i的后缀的子串个数
if (sum[n] < k) return puts("-1"), 0;
int L = 1, R = n, pl = 1;
for (int i = 1; i <= n; i++)
{
int l2 = L;
for (int j = 'a'; j <= 'z'; j++)
{
int l = l2, r = R, temp = l2 - 1;
while (l <= r)
{
int mid = (l + r) >> 1;
if (s[Sa[mid] + i - 1] > j)//如果第i为大于j,就变小一点
{
r = mid - 1;
}
else//小于等于->其实就是等于了
{
temp = mid;
l = mid + 1;
}
}
if (temp == l2 - 1)//没找到第i为j的情况的。直接continue;
{
continue;
}
//找到了多少个后缀以xxxj为前缀 ->temp-l2+1;
//然后算出来变成xxxj...会添加多少个子串
//只要把后缀的前缀为xxxj的后缀的子串个数累加起来,然后减去之前重复计数过
//的就好
ll have = sum[temp] - sum[l2 - 1] - 1LL * (i - 1)*(temp - l2 + 1);
//前面i-1位那个子串已经计数过了,不重复计数
if (k <= have)
{
//如果第i位是j的后缀的子串数目大于等于k了
//则可以肯定第i为肯定是j
if (temp - l2 + 1 >= k)//如果j是最后一个字符了,直接输出就好
return print(Sa[l2], Sa[l2] + i - 1), 0;
L = l2, R = temp;//否则可以缩小二分的范围,因为第i位已经固定是j了,只有某一段的后缀的第i位是j
k -= temp - l2 + 1;//xxxxj一共有temp-l2+1个
//要减去
break;
}
l2 = temp + 1, k -= have;//把第i位为j的后缀去掉,之后就不会管它了。
//所以直接跳到temp+1就好,然后因为第i位不是j,是大于j的,所以把xxxj...
//它所有的子串都去掉就好
}
}
}
puts("-1");
return 0;
}
【BZOJ 3998】弦论的更多相关文章
- bzoj 3998 弦论 —— 后缀自动机
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3998 关于相同子串算一个还是算多个,其实就是看一种状态的 right 集合是否加上 Pare ...
- BZOJ - 3998 弦论 (后缀自动机)
#include<cstdio> #include<cstring> #include<queue> using namespace std; typedef lo ...
- BZOJ 3998: [TJOI2015]弦论 [后缀自动机 DP]
3998: [TJOI2015]弦论 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2152 Solved: 716[Submit][Status] ...
- 【BZOJ 3998】 3998: [TJOI2015]弦论 (SAM )
3998: [TJOI2015]弦论 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2627 Solved: 881 Description 对于一 ...
- BZOJ 3998 [TJOI 2015] 弦论 解题报告
这是一道后缀自动机经典题目. 对于 $t=0$ 的情况:每个节点都代表一个子串,所以我们给每个节点的 $Size$ 都记为 $1$, 对于 $t=1$ 的情况:我们只给 $last$ 节点的 $Siz ...
- ●BZOJ 3998 [TJOI2015]弦论
题链: http://www.lydsy.com/JudgeOnline/problem.php?id=3998题解: 后缀自动机. 当T=0时, 由于在后缀自动机上沿着trans转移,每个串都是互不 ...
- BZOJ 3998: [TJOI2015]弦论 后缀自动机 后缀自动机求第k小子串
http://www.lydsy.com/JudgeOnline/problem.php?id=3998 后缀自动机应用的一个模板?需要对len进行一个排序之后再统计每个出现的数量,维护的是以该字符串 ...
- bzoj 3998 [TJOI2015]弦论——后缀自动机
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3998 相同子串算多个的话,先求好 right ,然后求一个 sm 表示走到这个点之后有几种走 ...
- BZOJ 3998 TJOI2015 弦论 后缀自动机+DAG上的dp
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3998 题意概述:对于一个给定长度为N的字符串,求它的第K小子串是什么,T为0则表示不同位置 ...
- bzoj 3998: [TJOI2015]弦论【SA+二分||SAM】
SA的话t==0直接预处理出每个后缀的不同串贡献二分即可,然后t==1就按字典序枚举后缀,然后跳右端点计算和当前后缀的前缀相同的子串个数,直到第k个 不过bzoj上会T #include<ios ...
随机推荐
- js --- return返回值 闭包
什么是闭包?这就是闭包! 有权访问另一个函数作用域内变量的函数都是闭包.这里 inc 函数访问了构造函数 a 里面的变量 n,所以形成了一个闭包. function a(){ var n = 0; f ...
- django框架初探
django框架初探 1.web框架介绍 web框架本质是一个socket服务端.每一个端口只能被一个程序监听. web程序分为两个部分: 服务器程序:对socket服务器封装,解析http请求,发送 ...
- 下载编译 Android wear 源代码,尝试制作可穿戴设备功能
体验 Android Wear 缘由: Android wear 代码公布已经非常久了.一直没有尝试,这里是个编译的过程和步骤,假设要尝试.本文假定读者已经有下载编译 Android 的经验,假设没 ...
- 将字符串使用md5加密
>>> import md5 >>> md5.md5('123').hexdigest() '202cb962ac59075b964b07152d234b70' & ...
- Codeforces #258 Div.2 E Devu and Flowers
大致题意: 从n个盒子里面取出s多花.每一个盒子里面的花都同样,而且每一个盒子里面花的多数为f[i],求取法总数. 解题思路: 我们知道假设n个盒子里面花的数量无限,那么取法总数为:C(s+n-1, ...
- HDU 3400 Line belt (三分再三分)
HDU 3400 Line belt (三分再三分) ACM 题目地址: pid=3400" target="_blank" style="color:rgb ...
- 经验之谈—让你看明确block
事实上我感觉不常常使用block的朋友.对block应该是比較陌生的,那么如今我们来扒开block的真面目,看看block的本质 普通的局部变量.block内部仅仅会引用它初始的值(block定义那一 ...
- Windows Server 2016 关闭Internet Explorer增强的安全配置
Windows Server 2016 关闭Internet Explorer增强的安全配置 IE11 默认启用 Internet Explorer 增强的安全配置,浏览网页时这个提示十分频繁,是不是 ...
- Android 多线程下载,断点续传,线程池
你可以在这里看到这个demo的源码: https://github.com/onlynight/MultiThreadDownloader 效果图 这张效果图是同时开启三个下载任务,限制下载线程数量的 ...
- Restlet 学习笔记
摘要:网络上对 restlet 的评判褒贬不一,有的说框架封装的很好,很有弹性,有的说 rest 架构风格本身是一种简单的风格,restlet 过设计以使编程过于复杂,其实我倒不觉得 restlet ...