【题目链接】 http://www.spoj.pl/problems/PHRASES/

【题目大意】

  求在每个字符串中出现至少两次的最长的子串

【题解】

  注意到这么几个关键点:最长,至少两次,每个字符串。
  首先对于最长这个条件,我们可以想到二分答案,
  然后利用后缀数组所求得的三个数组判断是否满足条件。
  其次是出现两次,每次出现这个条件的时候,
  我们就应该要想到这是最大值最小值可以处理的,
  将出现在同一个字符串中的每个相同字符串的起始位置保存下来,
  如果最小值和最大值的差距超过二分长度L,则表明在这个字符串中这个条件是可行的。
  将所有的字符串通过拼接符连接在一起,做一遍后缀数组,
  现在我们根据h数组将大于二分长度的前后后缀分为一组,
  每当存在分组中的后缀数量大于2*n,
  就说明这个字符串有可能是我们需要的答案,那么对它进行检验,
  检验所有可能合法的字符串就可以完成对一个长度的判断了。

【代码】

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using namespace std;
const int N=1000010;
int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N];
void suffixarray(int n,int m){
int i,j,k;n++;
for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
for(i=0;i<m;i++)cnt[i]=0;
for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
for(k=1;k<=n;k<<=1){
for(i=0;i<n;i++){
j=sa[i]-k;
if(j<0)j+=n;
tmp[cnt[rank[j]]++]=j;
}sa[tmp[cnt[0]=0]]=j=0;
for(i=1;i<n;i++){
if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
sa[tmp[i]]=j;
}memcpy(rank,sa,n*sizeof(int));
memcpy(sa,tmp,n*sizeof(int));
if(j>=n-1)break;
}for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}int first=0,len[N],u,K;
vector<int> S[N];
int Min[15],Max[15];
bool check(int L){
int cur=-1;
for(int i=1;i<=u;i++){
if(h[i]<L)S[++cur].clear();
S[cur].push_back(i);
}
for(int i=0;i<=cur;i++){
if(S[i].size()>=2*n){
memset(Min,-1,sizeof(Min));
memset(Max,-1,sizeof(Max));
for(int j=0;j<S[i].size();j++){
int k=S[i][j];
int x=upper_bound(a,a+n+1,sa[k])-a-1;
Min[x]=Min[x]==-1?sa[k]:min(Min[x],sa[k]);
Max[x]=Max[x]==-1?sa[k]:max(Max[x],sa[k]);
}bool flag=1;
for(int i=0;i<n;i++){
if(Min[i]==-1||Max[i]-Min[i]<L){flag=0;break;}
}if(flag)return 1;
}
}return 0;
}int T;
int main(){
scanf("%d",&T);
while(T--){
scanf("%d",&n);
int tmp=200; u=0;
for(int i=0;i<n;i++){
scanf("%s",str);
len[i]=strlen(str);
for(int j=0;j<len[i];j++)s[u++]=(int)str[j];
s[u++]=tmp++;
}tmp=0; s[u]=0; //注意处理完的字符串最后封零
for(int i=0;i<=n;i++){
a[i]=tmp;
if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1);
}suffixarray(u,310);
int l=1,r=10000,ans=0;
while(l<=r){
int mid=(l+r)>>1;
if(check(mid))ans=mid,l=mid+1;
else r=mid-1;
}printf("%d\n",ans);
}return 0;
}

  

SPOJ 220 Relevant Phrases of Annihilation(后缀数组+二分答案)的更多相关文章

  1. SPOJ - PHRASES Relevant Phrases of Annihilation —— 后缀数组 出现于所有字符串中两次且不重叠的最长公共子串

    题目链接:https://vjudge.net/problem/SPOJ-PHRASES PHRASES - Relevant Phrases of Annihilation no tags  You ...

  2. SPOJ 220 Relevant Phrases of Annihilation(后缀数组)

    You are the King of Byteland. Your agents have just intercepted a batch of encrypted enemy messages ...

  3. SPOJ220 Relevant Phrases of Annihilation(后缀数组)

    引用罗穗骞论文中的话: 先将n 个字符串连起来,中间用不相同的且没有出现在字符串中的字符隔开,求后缀数组.然后二分答案,再将后缀分组.判断的时候,要看是否有一组后缀在每个原来的字符串中至少出现两次,并 ...

  4. BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案

    BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description          给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单 ...

  5. Poj 1743 Musical Theme(后缀数组+二分答案)

    Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...

  6. Poj 3261 Milk Patterns(后缀数组+二分答案)

    Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...

  7. 2018.11.30 spoj220 Relevant Phrases of Annihilation(后缀数组+二分答案)

    传送门 代码: 先用特殊字符把所有字符串连接在一起. 然后二分答案将sasasa数组分组. 讨论是否存在一个组满足组内对于每一个字符串都存在两段不相交字串满足条件. #include<bits/ ...

  8. POJ3294--Life Forms 后缀数组+二分答案 大于k个字符串的最长公共子串

                                                                              Life Forms Time Limit: 500 ...

  9. POJ 3261 Milk Patterns(后缀数组+二分答案)

    [题目链接] http://poj.org/problem?id=3261 [题目大意] 求最长可允许重叠的出现次数不小于k的子串. [题解] 对原串做一遍后缀数组,二分子串长度x,将前缀相同长度超过 ...

随机推荐

  1. jQuery on()方法绑定动态元素的点击事件无效

    之前就一直受这个问题的困扰,在jQuery1.7版本之后添加了on方法,之前就了解过,其优越性高于live(),bind(),delegate()等方法,在此之前项目中想用这个来测试结果发现,居然动态 ...

  2. Dialog 不能全屏,左右有间距解决方案

    dialog 默认的样式@android:style/Theme.Dialog 对应的style 有pading属性,所以win.getDecorView().setPadding(0, 0, 0,  ...

  3. php的模板引擎

    设计一个交互式的网站,我们需要关注两个主要的问题:分别是图形用户界面和业务逻辑.例如,一个标准的web开发小组由两三个美工和三个程序员组成,则设计流程是:美工设计者制作了项目的网站的界面模板,然后把它 ...

  4. java通过JNI接口调用C语言-初级

    JNI(java native interface):即java本地调用C的接口. 先看整体运行: 下面是过程: #vim test.java public class test{ public na ...

  5. ADO.NET入门

    什么是ADO.NET ADO.NET就是一组类库,这组类库可以让我们通过程序的方式访问数据库,就像System.IO下的类用类操作文件一样, System.Data.这组类是用来操作数据库(不光是MS ...

  6. 解决Robotium测试用例crash问题

    今天遇到一个棘手的问题 用robotium框架真机测试客户端时 跑到一半会crash 搜了一堆资料终于解决了 我的程序引起crash主要原因有两个: 1.用Robotium测试框架跑多个用例(写在同一 ...

  7. C语言入门(8)——形参与实参

    对于带参数的函数,我们需要在函数定义中指明参数的个数和每个参数的类型,定义参数就像定义变量一样,需要为每个参数指明类型,并起一个符合标识符命名规则的名字.例如: #include <stdio. ...

  8. C++ *max_element函数找最大元素 *min_element函数找最小元素 STL算法(转)

    http://blog.sina.com.cn/s/blog_6f3a860501019z1f.html #include<iostream> #include<algorithm& ...

  9. 查找——图文翔解Treap(树堆)

    之前我们讲到二叉搜索树,从二叉搜索树到2-3树到红黑树到B-树. 二叉搜索树的主要问题就是其结构与数据相关,树的深度可能会非常大,Treap树就是一种解决二叉搜索树可能深度过大的还有一种数据结构. T ...

  10. MySQL 5.6.19 二进制安装

    1.        操作系统 CentOS release 6.2 (Final) 2.        创建用户和组 [root@mymaster1 ~]# groupadd mysql [root@ ...