uva11107 后缀数组
题意给了n个串 然后计算 这些串中的子串在大于1/2的串中出现 求出这个串的最长长度。 将这些串用一个每出现的不同的字符拼起来 ,然后二分找lcp
#include <iostream>
#include <algorithm>
#include <string.h>
#include <algorithm>
#include <vector>
#include <cstdio>
using namespace std;
const int maxn=;
const int maxm=;
const int MM=maxn*maxm;
struct SuffixArray
{
int s[MM]; // 原始字符数组(最后一个字符应必须是0,而前面的字符必须非0)
int sa[MM]; // 后缀数组
int rank[MM]; // 名次数组. rank[0]一定是n-1,即最后一个字符
int height[MM]; // height数组
int t[MM], t2[MM], c[MM]; // 辅助数组
int n; // 字符个数
void clear(){ n=; }
void build(int m)
{
int *x=t,*y=t2,i;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[i] = s[i] ]++;
for(i=; i<m; i++)c[ i ] += c[ i- ];
for(i = n-; i >= ; i--) sa[--c[x[i]]] = i;
for(int k=; k<=n; k<<=)
{
int p=;
for(i=n-k; i<n; i++)y[p++]=i;
for(i=; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[y[ i] ] ]++;
for(i=; i<m; i++)c[i]+=c[i-];
for(i =n-; i>=; i--)sa[ --c[ x[ y[i] ] ] ] = y[i];
swap(x,y);
p=;
x[ sa[] ] =;
for( i=; i<n; i++) x[ sa[i] ]= y[ sa[i] ]==y[sa[i-]] && y[ sa[i]+k ]== y[ sa[i-] +k ]?p-:p++;
if(p>=n)break;
m=p;
}
}
void build_height() {
int i, k = ;
for(i = ; i < n; i++) rank[sa[i]] = i;
height[]=;
for(i = ; i < n; i++) {
if(k) k--;
if(rank[i]==)continue;
int j = sa[rank[i]-];
while(i+k<n&&j+k<n&&s[i+k] == s[j+k]) k++;
height[rank[i]] = k;
}
}
}sa;
char word[MM];
int idx[MM],n,maxlen;
int flag[];
void add(int ch, int i)
{
idx[sa.n] = i;
sa.s[sa.n++] = ch;
}
// 子串[L,R) 是否符合要求
bool good(int L, int R,int &ss)
{ if(R - L <= n/) return false;
int cnt = ;
for(int i = L; i < R; i++) {
int x = idx[sa.sa[i]];
if(x != n && flag[x]!=ss) { flag[x] = ss; cnt++; }
}
return cnt > n/;
} void print_sub(int L, int R)
{
for(int i = L; i < R; i++)
printf("%c", sa.s[i] - + 'a');
printf("\n");
}
int ss;
bool print_solutions(int len, bool print)
{
int L = ;
ss++;
for(int R = ; R <= sa.n; R++) {
if(R == sa.n || sa.height[R] < len) { // 新开一段
if(good(L, R,ss)) {
if(print) print_sub(sa.sa[L], sa.sa[L] + len); else return true;
}
ss++;
L = R;
}
}
return false;
} void solve(int maxlen)
{
if(!print_solutions(, false))
printf("?\n");
else {
int L = , R = maxlen, M;
while(L < R) {
M = L + (R-L+)/;
if(print_solutions(M, false)) L = M;
else R = M-;
}
print_solutions(L, true);
}
} int main()
{
int kase=;
while(scanf("%d",&n)==)
{
if(n==)break;
if(kase++>) puts("");
maxlen=;
sa.clear();
for(int i=; i<n; i++)
{
scanf("%s",word);
int sz= strlen(word);
maxlen=max(sz,maxlen);
for(int j=; j<sz; j++)
{
add(word[j]-'a'+,i);
}
add(+i,n);
}
add(+n,n);
if(n==)printf("%s\n",word);
else
{
ss=;
memset(flag,,sizeof(flag));
sa.build( +n+ );
sa.build_height();
solve(maxlen);
}
}
return ;
}
uva11107 后缀数组的更多相关文章
- UVA11107 Life Forms --- 后缀数组
UVA11107 Life Forms 题目描述: 求出出现在一半以上的字符串内的最长字符串. 数据范围: \(\sum len(string) <= 10^{5}\) 非常坑的题目. 思路非常 ...
- uva11107(后缀数组)
uva11107 题意 输入 n 个 DNA 序列,求出长度最大的字符串,使得它在超过一半的 DNA 序列中连续出现.如果有多解,按字典序输出. 分析 论文 后缀数组经典题.加深几个关键数组的印象. ...
- 【UVA11107 训练指南】Life Forms【后缀数组】
题意 输入n(n<=100)个字符串,每个字符串长度<=1000,你的任务是找出一个最长的字符串使得超过一半的字符串都包含这个字符串. 分析 训练指南上后缀数组的一道例题,据说很经典(估计 ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- C语言位操作--两整数中的最大值与最小值
不用选择分支找出指定两整数中的最大值与最小值: int x; int y; // 找出x与y的最大值与最小值 int r; // r保存结果 r = y ^ ((x ^ y) & -(x &l ...
- [通信] C#多线程Socket-文件传输
FileSendClient : Form1.cs using System; using System.IO; using System.Net; using System.Net.Sockets; ...
- 在jmeter测试中模拟不同的带宽环境
怎么去测试在手机app中和在web的不同的连接速度对服务器的影响呢? 大部分情况下,手机终端用户通过移动网络访问网站.所以在不同的网络连接数据下,我们的网站或程序可以同时处理多少链接?今天,这篇文件就 ...
- Docker学习计划三:Dockerfile 使用
我们使用 Dockerfile 定义镜像,依赖镜像来运行容器,因此 Dockerfile 是镜像和容器的关键,Dockerfile 可以非常容易的定义镜像内容 首先通过一张图来了解 Docker 镜像 ...
- Thinkphp框架下对某个字段查询数据的时候进行唯一过滤,返回唯一不同的值
方法一. DISTINCT 方法用于返回唯一不同的值 . *distinct方法的参数是一个布尔值. 用法: $data = $Model->Distinct(true)->field(' ...
- thinkCMF----使用自定义函数
thinkCMF使用自定义函数:app 下新建 common.php
- Logstash在Linux上安装部署
Logstash 简介: Logstash 是一个实时数据收集引擎,可收集各类型数据并对其进行分析,过滤和归纳.按照自己条件分析过滤出符合数据导入到可视化界面.它可以实现多样化的数据源数据全量或增量传 ...
- Codeforces 838B - Diverging Directions - [DFS序+线段树]
题目链接:http://codeforces.com/problemset/problem/838/B You are given a directed weighted graph with n n ...
- Indexes (also called “keys” in MySQL)
High Performance MySQL, Third Edition by Baron Schwartz, Peter Zaitsev, and Vadim Tkachenko Is an ...
- JMeter(十)-正则表达式关联
jmeter中,接口自动化的关键在于参数关联.比如需要登录的接口,如何调用登录口令?一个增删改查的闭环,如何将接口参数上下传递?下面就以实际的例子来仔细说一说 1:登录接口 这里有一个实际的登录接口, ...