洛谷P4094 - [TJOI2016]字符串
Description
给出一个字符串\(s(|s|\leq10^5)\)和\(m\)次询问,每次询问子串\(s[x_1..x_2]\)的所有子串和\(s[y_1..y_2]\)的最长公共前缀长度的最大值。
Solution
后缀数组+二分答案+主席树。
易知\(s[x_1..x_2]\)的所有子串可以视为\(s[x_1..x_2]\)的所有后缀。那么可以得到:
考虑二分答案$ans\in [0,min(x_2-i+1,y_2-y_1+1)]$,二分结果为$len$。由于$lcp(i,y_1)$相当于一段区间的最小值,那么$rnk[i]$离$rnk[y_1]$越远就越小。那么我们可以再次二分来找到一个区间$[fr,to]$,$\forall i\in [fr,to]$,有$lcp(sa[i],y_1)\geq len$。那么检查是否有$sa[i]\in [x_1,x_2-len+1]$,若有则说明$len$合法,扩大$len$;否则不合法,缩小$len$。
于是我们要做的就是求$sa$的某个区间内是否有某个数在某个范围内。对$sa$建立$n$棵线段树,第$i$棵的第$j$位为$1$表示在$sa[1..i]$中有$j$。询问时查询两棵线段树的差即可。
> 时间复杂度$O((n+m)logn)$。
##Code
```cpp
//[TJOI2016]字符串
#include <cstdio>
#include <cstring>
inline int read()
{
int x=0; char ch=getchar();
while(ch<'0'||'9'<ch) ch=getchar();
while('0'<=ch&&ch<='9') x=x*10+ch-'0',ch=getchar();
return x;
}
inline int min(int x,int y) {return x<y?x:y;}
inline int swap(int &x,int &y) {int t=x; x=y,y=t;}
const int N=1e5+10;
int n,m; char s[N];
int sa[N],rnk[N<<1],h[N];
int cnt[N],tmp[N],rnk1[N];
int lg2[N],st[N][18];
void getSA()
{
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[s[i]]=1;
for(int i=1;i<=256;i++) cnt[i]+=cnt[i-1];
for(int i=1;i<=n;i++) rnk[i]=cnt[s[i]];
for(int L=1,k=0;k<n;L<<=1)
{
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[rnk[i+L]]++;
for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
for(int i=n;i>=1;i--) tmp[cnt[rnk[i+L]]--]=i;
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[rnk[tmp[i]]]++;
for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
for(int i=n;i>=1;i--) sa[cnt[rnk[tmp[i]]]--]=tmp[i];
k=0;
for(int i=1;i<=n;i++)
{
if(rnk[sa[i]]!=rnk[sa[i-1]]||rnk[sa[i]+L]!=rnk[sa[i-1]+L]) k++;
rnk1[sa[i]]=k;
}
memcpy(rnk,rnk1,sizeof rnk1);
}
for(int i=1,k=0;i<=n;i++)
{
if(rnk[i]==1) {h[1]=k=0; continue;}
if(k) k--;
while(s[i+k]==s[sa[rnk[i]-1]+k]) k++;
h[rnk[i]]=k;
}
lg2[1]=0; for(int i=2;i<=n;i++) lg2[i]=lg2[i>>1]+1;
for(int i=1;i<=n;i++) st[i][0]=h[i];
for(int k=1;(1<<k)<=n;k++)
for(int i=1;i+(1<<k)-1<=n;i++)
st[i][k]=min(st[i][k-1],st[i+(1<<k-1)][k-1]);
}
int lcp(int x,int y)
{
if(x==y) return n-x+1;
int i=rnk[x],j=rnk[y]; if(i>j) swap(i,j);
i++;
int t=lg2[j-i+1];
return min(st[i][t],st[j-(1<<t)+1][t]);
}
int ndCnt,rt[N];
struct node{int chL,chR; int cnt;} nd[N*18];
void update(int p) {nd[p].cnt=nd[nd[p].chL].cnt+nd[nd[p].chR].cnt;}
void ins(int &p,int L0,int R0,int x)
{
nd[++ndCnt]=nd[p]; p=ndCnt;
if(L0==R0) {nd[p].cnt++; return;}
int mid=L0+R0>>1;
if(x<=mid) ins(nd[p].chL,L0,mid,x);
else ins(nd[p].chR,mid+1,R0,x);
update(p);
}
int optL,optR;
int qres;
void query(int p1,int p2,int L0,int R0)
{
if(p1==p2) return;
if(optL<=L0&&R0<=optR) {qres+=nd[p2].cnt-nd[p1].cnt; return;}
int mid=L0+R0>>1;
if(optL<=mid) query(nd[p1].chL,nd[p2].chL,L0,mid);
if(mid<optR) query(nd[p1].chR,nd[p2].chR,mid+1,R0);
}
int x1,x2,y1,y2;
bool check(int len)
{
int fr=1,fr1=rnk[y1];
while(fr<=fr1)
{
int mid=fr+fr1>>1;
if(lcp(sa[mid],y1)<len) fr=mid+1;
else fr1=mid-1;
}
int to=rnk[y1],to1=n;
while(to<=to1)
{
int mid=to+to1>>1;
if(lcp(y1,sa[mid])<len) to1=mid-1;
else to=mid+1;
}
to--;
optL=x1,optR=x2-len+1,qres=0; query(rt[fr-1],rt[to],1,n);
return qres>0;
}
int main()
{
n=read(),m=read(); scanf("%s",s+1);
getSA();
for(int i=1;i<=n;i++) ins(rt[i]=rt[i-1],1,n,sa[i]);
for(int i=1;i<=m;i++)
{
x1=read(),x2=read(),y1=read(),y2=read();
int L=1,R=min(x2-x1+1,y2-y1+1);
while(L<=R)
{
int mid=L+R>>1;
if(check(mid)) L=mid+1;
else R=mid-1;
}
printf("%d\n",R);
}
return 0;
}
```\]
洛谷P4094 - [TJOI2016]字符串的更多相关文章
- 洛谷 P4094 [HEOI2016/TJOI2016]字符串(SA+主席树)
题面传送门 一道码农题---- u1s1 感觉这类题目都挺套路的,就挑个有代表性的题写一篇题解罢. 首先注意到答案满足可二分性,故考虑二分答案 \(mid\),转化为判定性问题. 考虑怎样检验 \(m ...
- 洛谷P4302 [SCOI2003]字符串折叠(区间dp)
题意 题目链接 Sol 裸的区间dp. 转移的时候枚举一下断点.然后判断一下区间内的字符串是否循环即可 `cpp #include<bits/stdc++.h> #define Pair ...
- 洛谷P4302 [SCOI]字符串折叠 [字符串,区间DP]
题目传送门 字符串折叠 题目描述 折叠的定义如下: 一个字符串可以看成它自身的折叠.记作S = S X(S)是X(X>1)个S连接在一起的串的折叠.记作X(S) = SSSS…S(X个S). 如 ...
- [洛谷P5329][SNOI2019]字符串
题目大意:给一个长度为$n$的字符串$s$,字符串$p_i$为字符串$s$去掉第$i$个字符后形成的字符串.请给所有字符串$p_i$排序(相同字符串按编号排序) 题解:先去掉所有连续相同字符,因为它们 ...
- 洛谷$P5329\ [SNOI2019]$字符串 字符串
正解:字符串 解题报告: 传送门$QwQ$ 有两个很妙的方法,分别港下$QwQ$ 首先为了表示方便,这里和题面一样设$s_i$表示去掉第$i$个字母得到的字符串.另设$lcp(i,j)$表示$suf_ ...
- 洛谷P5211 [ZJOI2017]字符串(线段树+乱搞)
题面 传送门 题解 为什么大佬们全都是乱搞的--莫非这就是传说中的暴力能进队,乱搞能AC-- 似乎有位大佬能有纯暴力+玄学优化\(AC\)(不算上\(uoj\)的\(Hack\)数据的话--这要是放到 ...
- 洛谷1026(字符串dp)
常规dp.看到数据很小就直接暴力了,没有预处理.kmp好像过分了-- #include <cstdio> #include <cstring> #include <ios ...
- 洛谷2758(字符串dp)
题目传送 记得这是我初学dp时的一道题 虽说就像LCS一样搞一搞即可 但我还是写挂了qwq #include <cstdio> #include <cstring> #incl ...
- 洛谷P3832 [NOI2017]蚯蚓排队 【链表 + 字符串hash】
题目链接 洛谷P3832 题解 字符串哈希然后丢到hash表里边查询即可 因为\(k \le 50\),1.2操作就暴力维护一下 经复杂度分析会发现直接这样暴力维护是对的 一开始自然溢出WA了,还以为 ...
随机推荐
- React Native 手工搭建环境 之iOS篇
常识 React native 开发服务器 在开发时,我们的框架是这样的:  当正式发布进入到生产环境时,开发服务器上所有的js文件将会被编译成包的形式,直接嵌入到客户端内.这时,已经不再需要开发服 ...
- PHP-PHPExcel用法详解
以下文章来源:diandian_520 http://blog.csdn.net/diandian_520/article/details/7827038 1.header header(" ...
- 【Web应用-大文件部署】上传超过 2M 的文件到 Azure PHP 网站失败
问题描述 上传超过 2M 的文件到 Azure PHP 网站失败. 问题分析 由于 PHP 本身默认上传文件的上限是 2M,所以当上传超过2M的文件时会报错. 解决方法 根据以下步骤进行配置: 在 s ...
- SQLite-表达式
SQLite -表达式 一个表达式是一个或多个值的组合,运算符和SQL函数,评价一个值. SQL表达式就像公式和都写在查询语言.您还可以使用为特定的数据集查询数据库. 语法: 考虑到SELECT语句的 ...
- 并查集+思维——Destroying Array
一.题目描述(题目链接) 给定一个序列,按指定的顺序逐一删掉,求连续子序列和的最大值.例如序列1 3 2 5,按3 4 1 2的顺序删除,即依次删除第3个.第4个.第1个.第2个,答案为5 4 3 0 ...
- Java调用存储过程出现Bug,sql语法错误
因为SQL Server运行没有正常,检查了传入参数的值,发现问题,然后传入默认参数,解决了问题.
- Linux内核漏洞利用-环境配置(转)
实验环境: Ubuntu-14.04.1 x86 linux-2.6.32.1 busybox-1.27.2 qemu 0x00 安装qemu sudo apt-get install qemu qe ...
- javascript的trigger事件
<html> <head> <script type="text/javascript" src="/jquery/jquery.js&qu ...
- jdk concurrent 中 AbstractQueuedSynchronizer uml 图.
要理解 ReentrantLock 先理解AbstractQueuedSynchronizer 依赖关系. 2
- jquery 获取tbody下的第二个tr 及多级标签
<div id="testSlider"> <div class="esriTimeSlider ies-Slider" id="t ...