UVA11107 Life Forms
思路
后缀数组
先都拼在一起
二分+height分段
按照小于x的为分界,判断是否有一个分段中包含超过n/2个串
代码
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
struct Node{
int pos,r[2];
}x[200100],midx[200100];
int n,sa[200100],ranks[200100],barrel[200100],height[200100],belong[200100],has[210],numx;
char s[200100],c[200100];
int c_sort(int n,int lim){
for(int i=0;i<2;i++){
memset(barrel,0,sizeof(barrel));
for(int j=1;j<=n;j++)
barrel[x[j].r[i]]++;
for(int j=1;j<=lim;j++)
barrel[j]+=barrel[j-1];
for(int j=n;j>=1;j--)
midx[barrel[x[j].r[i]]--]=x[j];
for(int j=1;j<=n;j++)
x[j]=midx[j];
}
ranks[x[1].pos]=1;
int cnt=1;
for(int i=2;i<=n;i++){
if(x[i].r[0]==x[i-1].r[0]&&x[i].r[1]==x[i-1].r[1])
ranks[x[i].pos]=cnt;
else
ranks[x[i].pos]=++cnt;
}
return cnt;
}
void cal_sa(int n){
for(int i=1;i<=n;i++)
x[i]=(Node){i,s[i],0};
int cnt=c_sort(n,255);
for(int i=1;cnt<n;i<<=1){
for(int j=1;j<=n;j++)
x[j]=(Node){j,(i+j<=n)?ranks[i+j]:0,ranks[j]};
cnt=c_sort(n,cnt);
}
for(int i=1;i<=n;i++)
sa[ranks[i]]=i;
for(int i=1,j=0,k;i<=n;height[ranks[i++]]=j)
for(j?j--:0,k=sa[ranks[i]-1];s[i+j]==s[j+k];j++);
}
// void init(void){
// for(int i=1;i<=n;i++)
// ST[i][0]=height[i];
// for(int i=1;i<20;i++)
// for(int j=1;j<=n;j++)
// ST[j][i]=min(ST[j][i-1],ST[min(j+(1<<(i-1)),n+10)][i-1]);
// }
// int query(int l,int r){
// l=ranks[l];
// r=ranks[r];
// l++;
// if(l>r)
// swap(l,r);
// int k=0;
// while((1<<k+1)<=(r-l+1))
// k++;
// return min(ST[l][k],ST[r-(1<<k)+1][k]);
// }
bool check(int x){
// printf("check %d\n",x);
memset(has,0,sizeof(has));
int midnum=0;
has[0]=true;
if(!has[belong[sa[1]]]){
++midnum;
has[belong[sa[1]]]=true;
}
if(midnum>(numx/2)){
return true;
}
for(int i=2;i<=n;i++){
if(height[i]<x){
memset(has,0,sizeof(has));
has[0]=true;
midnum=0;
if(!has[belong[sa[i]]]){
midnum++;
has[belong[sa[i]]]=true;
}
}
else{
if(!has[belong[sa[i]]]){
midnum++;
has[belong[sa[i]]]=true;
}
}
if(midnum>(numx/2)){
return true;
}
}
return false;
}
void print(int x){
memset(has,0,sizeof(has));
int midnum=0,f=1;
has[0]=true;
if(!has[belong[sa[1]]]){
++midnum;
has[belong[sa[1]]]=true;
}
if(midnum>(numx/2)&&f){
f=0;
for(int j=1;j<=x;j++)
putchar(s[sa[1]+j-1]);
putchar('\n');
}
for(int i=2;i<=n;i++){
if(height[i]<x){
f=1;
memset(has,0,sizeof(has));
has[0]=true;
midnum=0;
if(!has[belong[sa[i]]]){
midnum++;
has[belong[sa[i]]]=true;
}
}
else{
if(!has[belong[sa[i]]]){
midnum++;
has[belong[sa[i]]]=true;
}
}
if(midnum>(numx/2)&&f){
f=0;
for(int j=1;j<=x;j++)
putchar(s[sa[i]+j-1]);
putchar('\n');
}
}
}
void init(void){
memset(s,0,sizeof(s));
memset(height,0,sizeof(height));
memset(sa,0,sizeof(sa));
memset(ranks,0,sizeof(ranks));
memset(belong,0,sizeof(belong));
memset(midx,0,sizeof(midx));
memset(x,0,sizeof(x));
}
int main(){
// freopen("test.in","r",stdin);
// freopen("test.out","w",stdout);
int cnt=0;
while(scanf("%d",&numx)==1&&numx){
init();
n=0;
cnt++;
if(cnt>1)
putchar('\n');
if(numx==1){
scanf("%s",s);
printf("%s\n",s);
continue;
}
for(int i=1;i<=numx;i++){
scanf("%s",c+1);
int len=strlen(c+1);
for(int j=1;j<=len;j++){
s[n+j]=c[j];
belong[n+j]=i;
}
n+=len;
s[++n]='z'+i;
belong[n]=0;
}
// for(int i=1;i<=n;i++)
// putchar(s[i]);
// putchar('\n');
cal_sa(n);
// for(int i=1;i<=n;i++){
// printf("%d ",height[i]);
// }
// printf("\n");
// for(int i=1;i<=n;i++){
// printf("%d ",belong[sa[i]]);
// }
// printf("\n");
// printf("ok\n");
int l=0,r=n,ans=0;
while(l<=r){
int mid=(l+r)>>1;
if(check(mid))
l=mid+1,ans=mid;
else
r=mid-1;
}
// printf("ans=%d\n",ans);
if(ans==0){
printf("?\n");
}
else{
print(ans);
}
}
return 0;
}
UVA11107 Life Forms的更多相关文章
- UVA11107 Life Forms --- 后缀数组
UVA11107 Life Forms 题目描述: 求出出现在一半以上的字符串内的最长字符串. 数据范围: \(\sum len(string) <= 10^{5}\) 非常坑的题目. 思路非常 ...
- UVA11107 Life Forms SA模板
Life Forms Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 16827 Accepted: 4943 Descr ...
- UVA-11107 Life Forms(后缀数组)
题目大意:给出n个字符串,找出所有最长的在超过一半的字符串中出现的子串. 题目分析:将所有的字符串连成一个,二分枚举长度,每次用O(n)的时间复杂度判断.连接字符串的时候中间添一个没有出现过的字符. ...
- UVA-11107 Life Forms(求出现K次的子串,后缀数组+二分答案)
题解: 题意: 输入n个DNA序列,你的任务是求出一个长度最大的字符串,使得它在超过一半的DNA序列中出现.如果有多解,按照字典序从小到大输入所有解. 把n个DNA序列拼在一起,中间用没有出现过的字符 ...
- 【UVA11107 训练指南】Life Forms【后缀数组】
题意 输入n(n<=100)个字符串,每个字符串长度<=1000,你的任务是找出一个最长的字符串使得超过一半的字符串都包含这个字符串. 分析 训练指南上后缀数组的一道例题,据说很经典(估计 ...
- Wizard Framework:一个自己开发的基于Windows Forms的向导开发框架
最近因项目需要,我自己设计开发了一个基于Windows Forms的向导开发框架,目前我已经将其开源,并发布了一个NuGet安装包.比较囧的一件事是,当我发布了NuGet安装包以后,发现原来已经有一个 ...
- xamarin.forms新建项目android编译错误
vs2015 update3 新建的xamarin.forms项目中的android项目编译错误.提示缺少android_m2repository_r22.zip,96659D653BDE0FAEDB ...
- ASP.NET Forms 身份验证
ASP.NET Forms 身份验证 在开发过程中,我们需要做的事情包括: 1. 在 web.config 中设置 Forms 身份验证相关参数.2. 创建登录页. 登录页中的操作包括: 1. 验证用 ...
- Xamarin.Forms 简介
An Introduction to Xamarin.Forms 来源:http://developer.xamarin.com/guides/cross-platform/xamarin-forms ...
随机推荐
- Python+Selenium+PageObject
一.安装page_objects测试库 二.目录介绍 1.pages包:用于各界面元素定位,如BaseLoginPage.py 2.testcases包:用于编写各功能测试用例,如Login.py 3 ...
- c++11 强类型枚举 enum class
在标准C++中,枚举类型不是类型安全的.枚举类型被视为整数,这使得两种不同的枚举类型之间可以进行比较.C++03 唯一提供的安全机制是一个整数或一个枚举型值不能隐式转换到另一个枚举别型. 此外,枚举所 ...
- what's the 白盒测试
what's the 白盒测试 白盒测试又称结构测试.透明盒测试.逻辑驱动测试或基于代码的测试.盒子指的是被测试的软件,白盒指的是盒子是可视的,你清楚盒子内部的东西以及里面是如何运作的.白盒要考虑测试 ...
- 2019春第九周作业Compile Summarize
这个作业属于那个课程 C语言程序设计II 这个作业要求在哪里 这里 我在这个课程的目标是 能更加进一步的够熟练掌握指针的用法 这个作业在那个具体方面帮助我实现目标 能解更多的题 参考文献与网址 C语言 ...
- 关闭 synactive guixt. 在sap gui的右上角一个标志里,将 active guixt 选项去掉即可。
关闭 synactive guixt. 在sap gui的右上角一个标志里,将 active guixt 选项去掉即可.
- IDEA 破解_补丁永久_2018.3
主要是Eclipse我已经玩坏了三次了,切换jdk8到jdk10,再切换到jdk8,大量文件乱码,怎么改都没用,有的时候Eclipse久了不用,项目放在里面发霉了,坏掉了,MMP,换到I ...
- java操作对比两个字符串,将差异数据提取出来
记录瞬间 在实际的工作中,需要解决生成两次字符串结果进行对比的问题,将存在差异的字符串直接给出来. 当然,前提是需要将对比的两次结果,进行前期处理 比如: a_str = "@com/ene ...
- python实现使用词云展示图片
记录瞬间 首先,要安装一些第三方包 pip install scipyCollecting scipy Downloading https://files.pythonhosted.org/packa ...
- day12 python作业:员工信息表
作业要求: 周末大作业:实现员工信息表文件存储格式如下:id,name,age,phone,job1,Alex,22,13651054608,IT2,Egon,23,13304320533,Tearc ...
- bootstrap 无需引入 直接使用
<link href="http://libs.baidu.com/bootstrap/3.0.3/css/bootstrap.min.css" rel="styl ...