BZOJ 3172 Tjoi2013 单词 后缀数组
题目大意:给定一个n个单词的文章,求每一个单词在文章中的出现次数
文章长度<=10^6(不是单词长度<=10^6,不然读入直接超时)
首先将全部单词用空格连接成一个字符串。记录每一个单词的起始位置和长度
然后求后缀数组,对于每一个单词后缀数组中一定有连续一段后缀以这个单词开头,我们通过一開始记录的起始位置找到这个单词的后缀,然后左右端点二分答案,满足左右端点之间的后缀与原单词的LCP都当与等于原单词长度就可以
时间复杂度O(nlogn)
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define M 1001001
using namespace std;
int n,m;
char s[M];
int st[210],len[210];
int rank[M],sa[M],height[M],X[M],Y[M];
int sum[M],cnt[M],temp[M],tot;
int min_num[M][21],log2[M];
void Get_Rank()
{
int i;
for(i=1;i<=m;i++)
sum[s[i]]++;
for(i=1;i<=127;i++)
sum[i]+=sum[i-1];
for(i=1;i<=m;i++)
sa[ sum[s[i]-1]+ ++cnt[s[i]] ]=i;
for(i=1;i<=m;i++)
{
if(i==1||s[sa[i]]!=s[sa[i-1]])
++tot;
rank[sa[i]]=tot;
}
}
void Radix_Sort(int key[],int order[])
{
int i;
for(i=0;i<=m;i++)
sum[i]=cnt[i]=0;
for(i=1;i<=m;i++)
sum[key[i]]++;
for(i=1;i<=m;i++)
sum[i]+=sum[i-1];
for(i=1;i<=m;i++)
temp[ sum[key[order[i]]-1]+ ++cnt[key[order[i]]] ]=order[i];
for(i=1;i<=m;i++)
order[i]=temp[i];
}
void Get_Height()
{
int i,j,k;
for(i=1;i<=m;i++)
{
if(rank[i]==1) continue;
j=max(height[rank[i-1]]-1,0);k=sa[rank[i]-1];
while(s[i+j]==s[k+j]) j++;
height[rank[i]]=j;
}
}
void Prefix_Doubling()
{
int i,j;
Get_Rank();
for(j=1;j<=m;j<<=1)
{
for(i=1;i<=m;i++)
{
X[i]=rank[i];
Y[i]=i+j>m? 0:rank[i+j];
sa[i]=i;
}
Radix_Sort(Y,sa);
Radix_Sort(X,sa);
for(i=1,tot=0;i<=m;i++)
{
if( i==1 || X[sa[i]]!=X[sa[i-1]] || Y[sa[i]]!=Y[sa[i-1]] )
++tot;
rank[sa[i]]=tot;
}
}
Get_Height();
}
void Input()
{
int i;
char *p=s+1;
for(i=1;i<=n;i++)
{
scanf("%s",p);
st[i]=p-s;
len[i]=strlen(p);
*(p+=len[i],p++)=' ';
}
*(--p)=0;
m=p-s-1;
}
inline int Min(int x,int y)
{
if(x>y) return 0x3f3f3f3f;
return min( min_num[x][log2[y-x+1] ] , min_num[y-(1<<log2[y-x+1])+1][log2[y-x+1] ] );
}
int Left_Bisection(int i)
{
int l=1,r=rank[st[i]];
while(l+1<r)
{
int mid=l+r>>1;
if( Min(mid+1,rank[st[i]])>=len[i] )
r=mid;
else
l=mid;
}
if( Min(l+1,rank[st[i]])>=len[i] )
return l;
return r;
}
int Right_Bisection(int i)
{
int l=rank[st[i]],r=m;
while(l+1<r)
{
int mid=l+r>>1;
if( Min(rank[st[i]]+1,mid)>=len[i] )
l=mid;
else
r=mid;
}
if( Min(rank[st[i]]+1,r)>=len[i] )
return r;
return l;
}
int main()
{
int i,j;
cin>>n;
Input();
Prefix_Doubling();
log2[0]=-1;
for(i=1;i<=m;i++)
log2[i]=log2[i>>1]+1;
for(i=1;i<=m;i++)
min_num[i][0]=height[i];
for(j=1;j<=log2[m];j++)
for(i=1;i+(1<<j)-1<=m;i++)
min_num[i][j]=min( min_num[i][j-1] , min_num[i+(1<<j-1)][j-1] );
for(i=1;i<=n;i++)
{
int l=Left_Bisection(i);
int r=Right_Bisection(i);
printf("%d\n",r-l+1);
}
}
BZOJ 3172 Tjoi2013 单词 后缀数组的更多相关文章
- BZOJ 3172([Tjoi2013]单词-后缀数组第一题+RMQ)
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MB Submit: 268 Solved: 145 [ Submit][ St ...
- BZOJ 3172: [Tjoi2013]单词 [AC自动机 Fail树]
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3198 Solved: 1532[Submit][Status ...
- bzoj 3172: [Tjoi2013]单词 AC自动机
3172: [Tjoi2013]单词 Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://www.lydsy.com/JudgeOnline/pr ...
- ●BZOJ 3172 [Tjoi2013]单词
题链: http://www.lydsy.com/JudgeOnline/problem.php?id=3172 题解: 把单词逐个接起来,中间用互不相同的字符连接,并记录下每个单词的首字母在串中的位 ...
- [BZOJ 3172] [Tjoi2013] 单词 【AC自动机】
题目链接:BZOJ - 3172 题目分析: 题目要求求出每个单词出现的次数,如果把每个单词都在AC自动机里直接跑一遍,复杂度会很高. 这里使用AC自动机的“副产品”——Fail树,Fail树的一个性 ...
- bzoj 3172 [Tjoi2013]单词(fail树,DP)
[题目链接] http://www.lydsy.com/JudgeOnline/problem.php?id=3172 [题意] 题目的意思是这样的,给若干个单词,求每个单词在这一堆单词中的出现次数. ...
- BZOJ 3172 [Tjoi2013]单词 AC自动机Fail树
题目链接:[http://www.lydsy.com/JudgeOnline/problem.php?id=3172] 题意:给出一个文章的所有单词,然后找出每个单词在文章中出现的次数,单词用标点符号 ...
- bzoj 3172: [Tjoi2013]单词 fail树
题目大意: 一篇论文是由许多单词组成,现在想知道每个单词分别在论文中出现多少次. 题解: 我们首先考虑fail指针的含义 如果fail[x] = y,那么我们就知道y作为x的后缀在x中出现了一次 所以 ...
- 【刷题】BZOJ 3172 [Tjoi2013]单词
Description 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. Input 第一个一个整数N,表示有多少个单词,接下来N ...
随机推荐
- 【递推】Codeforces Round #483 (Div. 2) [Thanks, Botan Investments and Victor Shaburov!] D. XOR-pyramid
题意:定义,对于a数组的一个子区间[l,r],f[l,r]定义为对该子区间执行f操作的值.显然,有f[l,r]=f[l,r-1] xor f[l+1,r].又定义ans[l,r]为满足l<=i& ...
- 解耦你的HTML,CSS和JAVASRIPT
注:本文为翻译文章,原文<Decoupling Your HTML, CSS, and JavaScript> 今天在web上任何大一点的网站或应用程序都包含大量的html,css和jav ...
- Asky极简教程:零基础1小时学编程,已更新前8节
Asky极简架构 开源Asky极简架构.超轻量级.高并发.水平扩展.微服务架构 <Asky极简教程:零基础1小时学编程>开源教程 零基础入门,从零开始全程演示,如何开发一个大型互联网系统, ...
- 丢失或损坏NDF文件如何附加数据库
在论坛看到有人遇到 NDF文件丢失并且没有备份,所以无法成功附加数据库.在网上也看到过很多回答是如果没有NDF就无法附加成功. 其实我自己测试下来即使没有NDF也是可以成功附加的.但是有条件,丢失的N ...
- [Servlet]什么是Servlet
什么是Servlet Servlet是JavaEE三大组建之中的一个,是使用Java语言编写server端的程序,主要用来处理Web应用程序中的请求-响应. Servlet并没有main之类的执行方法 ...
- 解决Oracle11g空表无法导出的问题
Oracle11g 新增參数deferred_segment_creation ,建库的时候默认值为true,意思是延时载入,当表中不存在数据的时候,不为这个表创建空间,当你导出的时候会发现非常多表 ...
- 《TCP/IP具体解释卷2:实现》笔记--ICMP:Internet控制报文协议
ICMP在IP系统间传递差错和管理报文,是不论什么IP实现必须和要求的组成部分.能够把ICMP分成两类:差错和查询.查询报文 是用一对请求和回答定义的.差错报文通常包括了引起错误的IP包的第一个分片的 ...
- mormot当作内存数据库(缓存)使用
mormot当作内存数据库(缓存)使用 mormot的TSQLRestStorageInMemory可以作为内存数据库来使用. 上图是在笔者4代I5笔记本上做的测试,增加10万记录,耗时:562毫秒. ...
- Nginx+Memcached+Tomcat集群配置实践(Sticky Session)
准备工作 创建一个简单的web应用,名为session.其中有两个页面,分别如下所示: 页面login.jsp <%@ page language="java" conten ...
- UML状态图
状态图(Statechart digram)是系统分析的一种经常使用工具,系统分析员在对系统建模时,最先考虑的不是基于活动之间的控制流,而是基于状态之间的控制流,由于系统中对象的状态变化最易被发现和理 ...