【bzoj4310】跳蚤 后缀数组+二分
题目描述
输入
输出
样例输入
13
bcbcbacbbbbbabbacbcbacbbababaabbbaabacacbbbccaccbcaabcacbacbcabaacbccbbcbcbacccbcccbbcaacabacaaaaaba
样例输出
cbc
题解
后缀数组+二分
先使用后缀数组求出sa、rank和height,然后预处理出ST表,用倍增RMQ求LCP(再次偷改height的定义,height[i][j]表示sa[i]与sa[i-(1<<j)]的LCP)
然后我们二分答案串在S的所有子串中的排名。
这里用到了一个挺好理解的结论:一个串的本质不同的子串的个数为$\sum\limits_{i=1}^nn-sa[i]-height[i]$,就是某个字符开头的串的个数-重复出现过的串的个数。
有个这个结论可以做点什么?首先我们可以确定二分边界。
然后我们还可以根据子串的排名mid来求出对应的子串。
怎么求?我们从前往后枚举i,算出以sa[i]开头的本质不同的子串个数n-sa[i]-height[i],如果mid大于这个数就将mid减去这个数,否则对应的子串就是sa[i]开头,sa[i]+height[i]-1+mid结尾的字符串。退推一下,应该不是很难想。
那么有了子串以后,我们在原串上从后往前贪心,每次找到一个字符,就比较当前串和二分的子串的字典序大小关系,如果当前的子串字典序较大,则在这个找到的字符后面分割一下。最后比较分割次数与k的关系即可。
需要注意的是二分的子串必须大于等于单个的最大字符,否则无论怎样分割都不可能分割出小于等于该串的字符串。
#include <cstdio>
#include <cstring>
#include <algorithm>
#define N 100010
using namespace std;
typedef long long ll;
int sa[N] , r[N] , ws[N] , wa[N] , wb[N] , rank[N] , height[N][20] , n , m = 27 , log[N] , k , L , R;
char str[N];
void getsa()
{
int i , j , p , *x = wa , *y = wb;
for(i = 0 ; i < n ; i ++ ) ws[x[i] = r[i]] ++ ;
for(i = 1 ; i < m ; i ++ ) ws[i] += ws[i - 1];
for(i = n - 1 ; i >= 0 ; i -- ) sa[--ws[x[i]]] = i;
for(p = j = 1 ; p < n ; j <<= 1 , m = p)
{
for(p = 0 , i = n - j ; i < n ; i ++ ) y[p ++ ] = i;
for(i = 0 ; i < n ; i ++ ) if(sa[i] - j >= 0) y[p ++ ] = sa[i] - j;
for(i = 0 ; i < m ; i ++ ) ws[i] = 0;
for(i = 0 ; i < n ; i ++ ) ws[x[y[i]]] ++ ;
for(i = 1 ; i < m ; i ++ ) ws[i] += ws[i - 1];
for(i = n - 1 ; i >= 0 ; i -- ) sa[--ws[x[y[i]]]] = y[i];
for(swap(x , y) , x[sa[0]] = 0 , p = i = 1 ; i < n ; i ++ )
{
if(y[sa[i]] == y[sa[i - 1]] && y[sa[i] + j] == y[sa[i - 1] + j]) x[sa[i]] = p - 1;
else x[sa[i]] = p ++ ;
}
}
for(i = 1 ; i < n ; i ++ ) rank[sa[i]] = i;
for(p = i = 0 ; i < n - 1 ; height[rank[i ++ ]][0] = p)
for(p ? p -- : 0 , j = sa[rank[i] - 1] ; r[i + p] == r[j + p] ; p ++ );
}
void query(ll mid)
{
int i;
for(i = 1 ; i <= n ; i ++ )
{
if(n - sa[i] - height[i][0] < mid) mid -= n - sa[i] - height[i][0];
else
{
L = sa[i] , R = sa[i] + height[i][0] + mid - 1;
return;
}
}
L = 0 , R = n - 1;
}
int lcp(int x , int y)
{
if(x == y) return n;
x = rank[x] , y = rank[y];
if(x > y) swap(x , y);
int k = log[y - x];
return min(height[y][k] , height[x + (1 << k)][k]);
}
bool cmp(int l1 , int r1 , int l2 , int r2)
{
int t = lcp(l1 , l2) , len1 = r1 - l1 + 1 , len2 = r2 - l2 + 1;
if(len1 <= len2 && len1 <= t) return 1;
if(len1 > len2 && len2 <= t) return 0;
if(len1 <= t && len2 <= t) return len1 <= len2;
return r[l1 + t] <= r[l2 + t];
}
bool judge()
{
int i , cnt = 1 , last = n - 1;
for(i = n - 1 ; ~i ; i -- )
{
if(r[i] > r[L]) return 0;
if(!cmp(i , last , L , R)) cnt ++ , last = i;
if(cnt > k) return 0;
}
return 1;
}
int main()
{
int i , j;
ll lp = 1 , rp = 0 , mid , ans;
scanf("%d%s" , &k , str) , n = strlen(str);
for(i = 0 ; i < n ; i ++ ) r[i] = str[i] - 'a' + 1;
n ++ , getsa() , n -- ;
for(i = 2 ; i <= n ; i ++ ) log[i] = log[i >> 1] + 1;
for(i = 1 ; (1 << i) <= n ; i ++ )
for(j = (1 << i) ; j <= n ; j ++ )
height[j][i] = min(height[j][i - 1] , height[j - (1 << (i - 1))][i - 1]);
for(i = 1 ; i <= n ; i ++ ) rp += n - sa[i] - height[i][0];
while(lp <= rp)
{
mid = (lp + rp) >> 1 , query(mid);
if(judge()) ans = mid , rp = mid - 1;
else lp = mid + 1;
}
query(ans);
for(i = L ; i <= R ; i ++ ) putchar(str[i]);
return 0;
}
【bzoj4310】跳蚤 后缀数组+二分的更多相关文章
- [BZOJ4310] 跳蚤 - 后缀数组,二分,ST表
[BZOJ4310] 跳蚤 Description 首先,他会把串分成不超过 \(k\) 个子串,然后对于每个子串 \(S\) ,他会从 \(S\) 的所有子串中选择字典序最大的那一个,并在选出来的 ...
- bzoj 4310 跳蚤 —— 后缀数组+二分答案+贪心
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4310 二分答案——在本质不同的子串中二分答案! 如果二分到的子串位置是 st,考虑何时必须分 ...
- bzoj 4310 跳蚤——后缀数组+二分答案+贪心
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4310 答案有单调性? 二分出来一个子串,判断的时候需要满足那些字典序比它大的子串都不出现! ...
- BZOJ 3230: 相似子串( RMQ + 后缀数组 + 二分 )
二分查找求出k大串, 然后正反做后缀数组, RMQ求LCP, 时间复杂度O(NlogN+logN) -------------------------------------------------- ...
- BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案
BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l 读入单 ...
- BZOJ 1717 [USACO06DEC] Milk Patterns (后缀数组+二分)
题目大意:求可重叠的相同子串数量至少是K的子串最长长度 洛谷传送门 依然是后缀数组+二分,先用后缀数组处理出height 每次二分出一个长度x,然后去验证,在排序的后缀串集合里,有没有连续数量多于K个 ...
- POJ 1743 [USACO5.1] Musical Theme (后缀数组+二分)
洛谷P2743传送门 题目大意:给你一个序列,求其中最长的一对相似等长子串 一对合法的相似子串被定义为: 1.任意一个子串长度都大于等于5 2.不能有重叠部分 3.其中一个子串可以在全部+/-某个值后 ...
- Poj 1743 Musical Theme(后缀数组+二分答案)
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...
- Poj 3261 Milk Patterns(后缀数组+二分答案)
Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...
随机推荐
- 洛谷 P2424 约数和
题目背景 Smart最近沉迷于对约数的研究中. 题目描述 对于一个数X,函数f(X)表示X所有约数的和.例如:f(6)=1+2+3+6=12.对于一个X,Smart可以很快的算出f(X).现在的问题是 ...
- BZOJ 2539: [Ctsc2000]丘比特的烦恼
Time Limit: 1 Sec Memory Limit: 128 MBSubmit: 695 Solved: 260[Submit][Status][Discuss] Description ...
- 让您的 VS 2012/2013 升级开发 .NET 4.6 -- Targeting the .NET Framework 4.6 (多目标包)
原文出处:让您的 VS 2012/2013 升级开发 .NET 4.6 -- Targeting the .NET Framework 4.6 (多目标包) http://www.dotblogs.c ...
- RSA AES 前端JS与后台JAVA的加密解密的是实现
AES CryptoJS 前提是编码方式,key,vi中设置一样,就可以进行跨语言加密解密 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 ...
- JQuery EasyUI学习记录(二)
1.jquery easyUI动态添加选项卡(查看jquery easyUI手册) 1.1 用于动态添加一个选项卡 1.1.1 选中指定的选项卡和判断某个选项卡是否存在 测试代码: <a id= ...
- linux下libnet编程 亲自测试可用
linux下libnet编程 亲自测试可用 亲自测试 如果build包的时候 只要把类型改了 就能改成相应的协议. 0x0800 ip 0x0806 arp 0x86DD IPv6 0x86e ...
- console.log与console.dir的区别
今天学习promise的时候看到了console.dir这个方法,感到很好奇,查了以下感觉又长知识了 在Chrome中,控制台对象定义了两个似乎做同样事情的方法: console.log() cons ...
- 【转】嵌入式操作系统VxWorks中TFFS文件系统的构建
时间:2005-02-20 来源:21IC中国电子网 作者:771所加固机工程部 蔡本华 高文炜 关键字:VxWorks TFFS 嵌入式操作系统 文件系统 摘要:目前的嵌入式 ...
- c++基本配置属性页
怎么调试一个项目. 需要配置好环境. 在一个release版本的环境中,调试要用release-debug版本,一般不用debug版本. 配置类型一般不变.
- 【哈希 二分】bzoj2084: [Poi2010]Antisymmetry
可以用manacher或者SA搞过去的:非常有趣的hash题 Description 对于一个01字符串,如果将这个字符串0和1取反后,再将整个串反过来和原串一样,就称作“反对称”字符串.比如0000 ...