【题目链接】 http://poj.org/problem?id=3294

【题目大意】

  求出在至少在一半字符串中出现的最长子串。
  如果有多个符合的答案,请按照字典序输出。

【题解】

  将所有的字符串通过不同的拼接符相连,作一次后缀数组,
  二分答案的长度,然后在h数组中分组,判断是否可行,
  按照sa扫描输出长度为L的答案即可。注意在一个子串中重复出现答案串的情况。

【代码】

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using namespace std;
const int N=1000010;
int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N];
void suffixarray(int n,int m){
int i,j,k;n++;
for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
for(i=0;i<m;i++)cnt[i]=0;
for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
for(k=1;k<=n;k<<=1){
for(i=0;i<n;i++){
j=sa[i]-k;
if(j<0)j+=n;
tmp[cnt[rank[j]]++]=j;
}sa[tmp[cnt[0]=0]]=j=0;
for(i=1;i<n;i++){
if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
sa[tmp[i]]=j;
}memcpy(rank,sa,n*sizeof(int));
memcpy(sa,tmp,n*sizeof(int));
if(j>=n-1)break;
}for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}int first=0,len[N],u,K;
vector<int> S[N];
bool vis[N];
bool check(int L){
int cur=-1;
for(int i=1;i<=u;i++){
if(h[i]<L)S[++cur].clear();
S[cur].push_back(i);
}
for(int i=0;i<=cur;i++){
if(S[i].size()>K){
memset(vis,0,sizeof(vis));
for(int j=0;j<S[i].size();j++){
int k=S[i][j];
int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1;
vis[x]=1;
}int count=0;
for(int j=0;j<n;j++)if(vis[j])count++;
if(count>K)return 1;
}
}return 0;
}
void Print(int L){
int cur=-1;
for(int i=1;i<=u;i++){
if(h[i]<L)S[++cur].clear();
S[cur].push_back(i);
}
for(int i=0;i<=cur;i++){
if(S[i].size()>K){
memset(vis,0,sizeof(vis));
for(int j=0;j<S[i].size();j++){
int k=S[i][j];
int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1;
vis[x]=true;
}int count=0;
for(int j=0;j<n;j++)if(vis[j])count++;
if(count>K){
for(int j=0;j<L;j++)printf("%c",char(s[sa[S[i][0]]+j]));
puts("");
}
}
}
}
int main(){
while(~scanf("%d",&n),n){
if(first++)puts("");
int tmp=200; u=0;
for(int i=0;i<n;i++){
scanf("%s",str);
len[i]=strlen(str);
for(int j=0;j<len[i];j++)s[u++]=(int)str[j];
s[u++]=tmp++;
}tmp=0; s[u]=0;
for(int i=0;i<=n;i++){
a[i]=tmp;
if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1);
}suffixarray(u,310);
int l=1,r=1000,ans=0;
K=n/2;
while(l<=r){
int mid=(l+r)>>1;
if(check(mid))ans=mid,l=mid+1;
else r=mid-1;
}if(ans==0)puts("?");
else Print(ans);
}return 0;
}

  

POJ 3294 Life Forms(后缀数组+二分答案)的更多相关文章

  1. poj 3294 Life Forms - 后缀数组 - 二分答案

    题目传送门 传送门I 传送门II 题目大意 给定$n$个串,询问所有出现在严格大于$\frac{n}{2}$个串的最长串.不存在输出'?' 用奇怪的字符把它们连接起来.然后求sa,hei,二分答案,按 ...

  2. Poj 3294 Life Forms (后缀数组 + 二分 + Hash)

    题目链接: Poj 3294 Life Forms 题目描述: 有n个文本串,问在一半以上的文本串出现过的最长连续子串? 解题思路: 可以把文本串用没有出现过的不同字符连起来,然后求新文本串的heig ...

  3. POJ 3294 Life Forms 后缀数组+二分 求至少k个字符串中包含的最长子串

    Life Forms   Description You may have wondered why most extraterrestrial life forms resemble humans, ...

  4. Poj 1743 Musical Theme(后缀数组+二分答案)

    Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...

  5. Poj 3261 Milk Patterns(后缀数组+二分答案)

    Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...

  6. POJ3294--Life Forms 后缀数组+二分答案 大于k个字符串的最长公共子串

                                                                              Life Forms Time Limit: 500 ...

  7. POJ 1226 Substrings(后缀数组+二分答案)

    [题目链接] http://poj.org/problem?id=1226 [题目大意] 求在每个给出字符串中出现的最长子串的长度,字符串在出现的时候可以是倒置的. [题解] 我们将每个字符串倒置,用 ...

  8. poj 3415 Common Substrings - 后缀数组 - 二分答案 - 单调栈

    题目传送门 传送点I 传送点II 题目大意 给定串$A, B$,求$A$和$B$长度大于等于$k$的公共子串的数量. 根据常用套路,用一个奇怪的字符把$A$,$B$连接起来,然后二分答案,然后按mid ...

  9. BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案

    BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description          给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单 ...

随机推荐

  1. leetcode first bad version python

    # The isBadVersion API is already defined for you. # @param version, an integer # @return a bool # d ...

  2. Eclipse 完全 设置UTF-8 环境

    当开始一个新的Java项目时,最好将整个环境设置为UTF-8 一般通过如下几步来设置: 1: 设置工作空间的编码格式:Window -> Preferences -> General -& ...

  3. 关于AJAX+HTML5+ASHX进行全静态页面的数据交互

    及时总结项目中使用到的知识,知识在于积累. 1.HTML代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN ...

  4. php部分学习笔记

    [web 开发分为]1. 静态web 开发(html 页面) 如果我们的一个页面,始终是一成不变的,则就是属于静态web 开发,一般讲用html 技术就ok2. 动态web 开发 比如: 我们需要发帖 ...

  5. 什么是位、字节、字、KB、MB

    什么是位.字节.字.KB.MB 位:"位(bit)"是电子计算机中最小的数据单位.每一位的状态只能是0或1. 字节:8个二进制位构成1个"字节(Byte)",它 ...

  6. 手把手教程 Surface如何进行系统恢复?

    手把手教程 Surface如何进行系统恢复? 2015-01-29 05:53:00  [  中关村在线 原创  ]   作者: 周博林 |  责编:周博林 收藏文章 分享到 评论(10) Windo ...

  7. Nginx模块开发入门(转)

    前言 Nginx是当前最流行的HTTP Server之一,根据W3Techs的统计,目前世界排名(根据Alexa)前100万的网站中,Nginx的占有率为6.8%.与Apache相比,Nginx在高并 ...

  8. 2014 Web开发趋势

    本文翻译自:http://www.pixelstech.net/article/1401629232-Web-design-trends-for-2014 如今,已然到了Web横行的时代.越来越多的资 ...

  9. Linux用户及用户组管理

    Linux是个优秀的多用户多任务操作系统. 掌握Linux的用户/用户组管理是基本及必备技能之一. 简单做下总结. 无论采用图形界面的用户管理设置,还是终端的管理方式,最终目的都是对系统的用户/用户组 ...

  10. SQL练习之求解填字游戏

    SELECT * FROM dbo.spt_values