谢特——后缀数组+tire 树
题目
【题目描述】
由于你成功地在 $ \text{1 s} $ 内算出了上一题的答案,英雄们很高兴并邀请你加入了他们的游戏。然而进入游戏之后你才发现,英雄们打的游戏和你想象的并不一样……
英雄们打的游戏是这样的:首先系统会产生(**注意不一定是随机产生**)一个字符串,然后每个英雄就会开始根据自己分到的任务计算这个字符串的某些特征,谁先算出自己的答案谁就是胜者。
由于打游戏的英雄比较多,因此英雄们分到的任务也就可能很奇怪。比如你分到的这个任务就是这样:
定义这个字符串以第 $ i $ 个字符开头的后缀为后缀 $ i $ (编号从 $ 1 $ 开始),每个后缀 $ i $ 都有一个权值 $ w_i $ ,同时定义两个后缀 $ i,j $ ($ i\ne j $) 的贡献为它们的最长公共前缀长度加上它们权值的异或和,也就是 $ \mathrm{LCP}(i,j)+(w_i \mathbin{\text{xor}} w_j) $ 。而你的任务就是,求出这个字符串的所有后缀两两之间贡献的最大值。
【输入格式】
第一行一个正整数 $ n $,表示字符串的长度。
第二行一个仅包含小写英文字母的字符串,即系统产生的字符串。
第三行 $ n $ 个非负整数 $ w_i $,分别表示后缀 $ 1 $ ~ $ n $ 的权值。
【输出格式】
一行一个整数表示答案。
【样例输入】
7
acbabac
0 1 5 6 4 2 3
【样例输出】
7
【样例解释】
后缀 $ 1 $ 和后缀 $ 4 $ 的贡献是 $ 1+(0\;\text{xor}\;6)=7 $ ,不难验证它们的贡献确实是所有可能的贡献中最大的。
【数据范围与提示】
对于 $ 30\% $ 的数据,$ n\le 5\times 10^3 $;
对于另 $ 30\% $ 的数据,保证字符串是随机生成的;
对于另 $ 10\% $ 的数据,$ w_i=0 $;
对于另 $ 10\% $ 的数据,$ w_i\le 1 $;
对于 $ 100\% $ 的数据,$ n\le 10^5 $,$ w_i< n $ 。
题解
求任意两个后缀的 LCP 很容易想到后缀数组
记排序后的两个相邻后缀 $ i-1,i $ 的 LCP 为 $ height[i] $
那么任意的两个后缀 $ i,j $ 的 LCP 为 $ min_{k=i}^{j}height[k] $
至于求 $W$ 的异或值考虑在 tire 树上贪心
当 $ height[i] $ 为 $[l,r] $ 的最小值时才会对该区间有影响,那么考虑如何用 $ height[i] $ 来更新答案
将 $ height[i] $ 从大到小排序后,合并 $ P_i $ 和 $ P_{i-1} $ 属于的两个区间 $ [L_{P_i},R_{p_i}] $ 和 $ [L_{P_{i-1}},R_{P_{i-1}}] $,此时保证 $ height[i] $ 为两个区间中的最小值(因为比 $ i $ 大的已经合并了)
然后在 tire 树上启发式合并两个区间即可,贪心选取答案
时间效率:$ O(n \log n+n \log^2n)$
至于 SA 的排序可以用倍增法或者二分哈希都可以(也就多一个 $ \log $,反正启发式合并也要 $ \log^2 $)
为什么我一点都没有感觉到套路,可能是题写太少了
代码
- #include<bits/stdc++.h>
- #define LL long long
- #define _(d) while(d(isdigit(ch=getchar())))
- using namespace std;
- int R(){
- int x;bool f=;char ch;_(!)if(ch=='-')f=;x=ch^;
- _()x=(x<<)+(x<<)+(ch^);return f?x:-x;}
- const int N=2e5+;
- int n,m,w[N],p[N],ht[N],rak[N],tp[N],sa[N],tax[N],ans;
- char ch[N];
- void Qsort(){
- for(int i=;i<=m;i++)tax[i]=;
- for(int i=;i<=n;i++)tax[rak[tp[i]]]++;
- for(int i=;i<=m;i++)tax[i]+=tax[i-];
- for(int i=n;i>=;i--)sa[tax[rak[tp[i]]]--]=tp[i];
- }
- void SA(){
- m=,Qsort();
- for(int l=,p=;l<=n;l<<=){
- for(int i=n-l+;i<=n;i++)tp[++p]=i;
- for(int i=;i<=n;i++)if(sa[i]>l)tp[++p]=sa[i]-l;
- Qsort(),swap(rak,tp);
- rak[sa[]]=p=;
- for(int i=;i<=n;i++)
- rak[sa[i]]=(tp[sa[i-]]==tp[sa[i]]&&tp[sa[i-]+l]==tp[sa[i]+l])?p:++p;
- if(p>n)break;
- m=p+,p=;
- }
- int k=;
- for(int i=,j;i<=n;i++){
- j=sa[rak[i]-];
- if(k)k--;
- while(ch[j+k]==ch[i+k])k++;
- ht[rak[i]]=k;
- }
- }
- bool cmp(int a,int b){return ht[a]>ht[b];}
- int li[N],ri[N],fa[N],rt[N],tot,tr[N*][];
- int query(int k,int dep,int val){
- if(!~dep)return ;
- if(tr[k][((val>>dep)&)^])
- return (<<dep)+query(tr[k][((val>>dep)&)^],dep-,val);
- else return query(tr[k][(val>>dep)&],dep-,val);
- }
- void insert(int &k,int dep,int val){
- if(!k)k=++tot;
- if(~dep)insert(tr[k][(val>>dep)&],dep-,val);
- }
- int merge(int x,int y){
- int res=;
- if(ri[x]-li[x]<ri[y]-li[y])swap(x,y);
- for(int i=li[y];i<=ri[y];i++)
- res=max(res,query(rt[x],,w[sa[i]]));
- for(int i=li[y];i<=ri[y];i++)
- insert(rt[x],,w[sa[i]]);
- fa[y]=x,li[x]=min(li[x],li[y]),ri[x]=max(ri[x],ri[y]);
- return res;
- }
- int find(int x){return fa[x]==x?x:fa[x]=find(fa[x]);}
- int main(){
- n=R(),scanf("%s",ch+);
- for(int i=;i<=n;i++)
- rak[i]=ch[i]-'a',p[i]=tp[i]=i,w[i]=R();
- SA(),sort(p+,p+n+,cmp);
- for(int i=;i<=n;i++)
- li[i]=ri[i]=fa[i]=i,insert(rt[i],,w[sa[i]]);
- for(int i=;i<=n;i++)
- ans=max(ans,ht[p[i]]+merge(find(p[i]-),find(p[i])));
- cout<<ans<<endl;
- return ;
- }
谢特——后缀数组+tire 树的更多相关文章
- 中文分词系列(一) 双数组Tire树(DART)详解
1 双数组Tire树简介 双数组Tire树是Tire树的升级版,Tire取自英文Retrieval中的一部分,即检索树,又称作字典树或者键树.下面简单介绍一下Tire树. 1.1 Tire树 Trie ...
- 中文分词系列(二) 基于双数组Tire树的AC自动机
秉着能偷懒就偷懒的精神,关于AC自动机本来不想看的,但是HanLp的源码中用户自定义词典的识别是用的AC自动机实现的.唉-没办法,还是看看吧 AC自动机理论 Aho Corasick自动机,简称AC自 ...
- BZOJ 1396: 识别子串( 后缀数组 + 线段树 )
这道题各位大神好像都是用后缀自动机做的?.....蒟蒻就秀秀智商写一写后缀数组解法..... 求出Height数组后, 我们枚举每一位当做子串的开头. 如上图(x, y是height值), Heigh ...
- 【XSY1551】往事 广义后缀数组 线段树合并
题目大意 给你一颗trie树,令\(s_i\)为点\(i\)到根的路径上的字符组成的字符串.求\(max_{u\neq v}(LCP(s_u,s_v)+LCS(s_u,s_v))\) \(LCP=\) ...
- BZOJ3473:字符串(后缀数组,主席树,二分,ST表)
Description 给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串? Input 第一行两个整数n,k. 接下来n行每行一个字符串. Output 一 ...
- BZOJ 2865 字符串识别 | 后缀数组 线段树
集训讲字符串的时候我唯一想出正解的题-- 链接 BZOJ 2865 题面 给出一个长度为n (n <= 5e5) 的字符串,对于每一位,求包含该位的.最短的.在原串中只出现过一次的子串. 题解 ...
- [BZOJ4556][Tjoi2016&Heoi2016]字符串 后缀数组+主席树
4556: [Tjoi2016&Heoi2016]字符串 Time Limit: 20 Sec Memory Limit: 128 MB Description 佳媛姐姐过生日的时候,她的小 ...
- LOJ_#2720. 「NOI2018」你的名字 _后缀数组+主席树+倍增
题面: https://loj.ac/problem/2720 考虑枚举T串的每个后缀i,我们要做两件事. 一.统计有多少子串[i,j]在S中要求位置出现. 二.去重. 第二步好做,相当于在后缀数组上 ...
- P5346 【XR-1】柯南家族(后缀数组+主席树)
题目 P5346 [XR-1]柯南家族 做法 聪明性是具有传递性的,且排列是固定的 那么先预处理出每个点的名次,用主席树维护\(k\)大值 一眼平衡树,遍历的同时插入\(O(log^2n)\),总时间 ...
随机推荐
- Codeforces Round #377 (Div. 2) F - Tourist Reform
前言:关于如何求双连通分量,我们可以在tarjan搜索时标记下所有桥的位置(双连通分量(可以认为是没有桥的无向图图)即可通过删去所有桥得到),那么怎么找桥呢,对于每一条搜索到的边u->x,如果l ...
- jQuery Cloud Zoom:图片放大镜插件 破解插件
/* Cloud Zoom 10 Site License (CZ01-10). Version 3.1 rev 1312051822 */ (function(e) { function s(a) ...
- codeforces 631A A. Interview
A. Interview time limit per test 1 second memory limit per test 256 megabytes input standard input o ...
- 【二叉树的递归】07路径组成数字的和【Sum Root to Leaf Numbers】
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 给定一个二叉树,节点的值仅限于从0 ...
- RTP 打包H264与AAC
static int h264_parse(Track *tr, uint8_t *data, size_t len) { h264_priv *priv = tr->private_data; ...
- ACM学习历程—51NOD1028 大数乘法V2(FFT)
题目链接:http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1028 题目大意就是求两个大数的乘法. 但是用普通的大数乘法,这 ...
- jumpserver遇到的坑
安装:https://github.com/jumpserver/jumpserver,看readme照着做就行,下面是遇到的坑. 0.4.4版坑: 1.要升级pip,否则有的包装不上 2.p ...
- grep的用法(转)
grep参数 -c : 显示匹配的行数(就是显示有多少行匹配了): -n :显示匹配内容所在文档的行号: -i :匹配时忽略大小写: -s :错误信息不输出: -v :输出不匹配内容: -o : ...
- 资料:MVC框架+SQL Server 数据集成引擎
ylbtech-资料:MVC框架+SQL Server 数据集成引擎 1.返回顶部 1. 功能特点: MVC框架耦合性低视图层和业务层分离,这样就允许更改视图层代码而不用重新编译模型和控制器代码,同样 ...
- C语言 mmap()函数(建立内存映射) 与 munmap()函数(解除内存映射)
mmap将一个文件或者其它对象映射进内存.文件被映射到多个页上,如果文件的大小不是所有页的大小之和, 最后一个页不被使用的空间将会清零.mmap在用户空间映射调用系统中作用很大. 条件 mmap()必 ...