CF666E Forensic Examination SAM+线段树合并+前缀树倍增
$ \color{#0066ff}{ 题目描述 }$
给你一个串\(S\)以及一个字符串数组\(T[1..m]\),\(q\)次询问,每次问\(S\)的子串\(S[p_l..p_r]\)在\(T[l..r]\)中的哪个串里的出现次数最多,并输出出现次数。
如有多解输出最靠前的那一个。
\(\color{#0066ff}{输入格式}\)
第一行一个个字符串表示\(S\)
第二行一个数字\(m\)
接下来\(m\)行每行一个字符串表示\(T[i]\)
接下来一行一个数字\(q\)表示询问次数
接下来\(q\)行每行四个数字\(l,r,ql,qr\)表示一个询问
\(\color{#0066ff}{输出格式}\)
共\(q\)行每行两个数字表示出现位置和次数
\(\color{#0066ff}{输入样例}\)
suffixtree
3
suffixtreesareawesome
cartesiantreeisworsethansegmenttree
nyeeheeheee
2
1 2 1 10
1 3 9 10
\(\color{#0066ff}{输出样例}\)
1 1
3 4
\(\color{#0066ff}{数据范围与提示}\)
\(1<=∣s∣<=5*10^5,1<=m<=5*10^4,1<=q<=5*10^5\)
\(\color{#0066ff}{题解}\)
考虑暴力,我们可以建立m个后缀自动机,然后暴力匹配, 复杂度是\(O(nmq)\)的
这样无论如何都要枚举m个后缀自动机,复杂度是无法优化的
我们考虑另一种思路,建立广义后缀自动机,每个节点记录一下属于哪个串bel,那么如果我们匹配之后到了某个点,我们需要在这个点的前缀树的子树内找到一个出现次数最多的bel且bel尽量小(靠左)
也就是找子树最大值以及位置,我们考虑对前缀树上的每个点开一个动态开点线段树,维护子树内bel的最大值以及位置,这个刚开始可以先在extend中记录维护自己的东西,然后dfs前缀树,把子树内的线段树合并,这样每个点维护的就是子树内的线段树了
于是对于一个询问,我们暴力匹配它的字串,跳到那个点,然后在那个点的线段树上查询就行了
于是我们的复杂度由\(O(nmq)\)降到了\(O(q * n * logm)\)
但是这样依然是过不了,时间浪费在了匹配上
我们考虑优化匹配这个过程
考虑在前缀树上倍增,因为每次跳父亲就是删去前面若干字符,所以我们可以先预处理出S的每个前缀在后缀自动机上的匹配情况,记录一下这个前缀的最长匹配后缀和匹配到的节点
对于一个询问, 字串\([l,r]\),我们直接找到\(S[1...r]\)的匹配节点,然后倍增往上跳,删去l前面的节点, 就是我们匹配的节点,然后再线段树查询就行了
这样\(O(q*logn*logm)\)就能过了
#include<bits/stdc++.h>
#define LL long long
LL in() {
char ch; LL x = 0, f = 1;
while(!isdigit(ch = getchar()))(ch == '-') && (f = -f);
for(x = ch ^ 48; isdigit(ch = getchar()); x = (x << 1) + (x << 3) + (ch ^ 48));
return x * f;
}
const int maxn = 7e5 + 100;
struct Tree {
protected:
struct node {
node *ch[2];
int max, pos;
node(int max = 0, int pos = 0): max(max), pos(pos) { ch[0] = ch[1] = NULL; }
void upd() {
if(!ch[0] && !ch[1]) return;
if(!ch[0]) max = ch[1]->max, pos = ch[1]->pos;
else if(!ch[1]) max = ch[0]->max, pos = ch[0]->pos;
else {
if(ch[0]->max >= ch[1]->max) max = ch[0]->max, pos = ch[0]->pos;
else max = ch[1]->max, pos = ch[1]->pos;
}
}
}*root[maxn];
int n;
void add(node *&o, int l, int r, int pos, int val) {
if(!o) o = new node();
if(l == r) return (void)(o->max += val, o->pos = l);
int mid = (l + r) >> 1;
if(pos <= mid) add(o->ch[0], l, mid, pos, val);
else add(o->ch[1], mid + 1, r, pos, val);
o->upd();
}
std::pair<int, int> query(node *o, int l, int r, int ql, int qr) {
if(!o) return std::make_pair(0, ql);
if(ql <= l && r <= qr) return std::make_pair(o->max, o->pos);
int mid = (l + r) >> 1;
if(qr <= mid) return query(o->ch[0], l, mid, ql, qr);
if(ql > mid) return query(o->ch[1], mid + 1, r, ql, qr);
std::pair<int, int> ansl = query(o->ch[0], l, mid, ql, qr);
std::pair<int, int> ansr = query(o->ch[1], mid + 1, r, ql, qr);
if(ansl.first >= ansr.first) return ansl;
return ansr;
}
node *merge(node *x, node *y, int l, int r) {
if(!x || !y) return x? x : y;
node *o = new node();
if(l == r) return o->max = x->max + y->max, o->pos = l, o;
int mid = (l + r) >> 1;
o->ch[0] = merge(x->ch[0], y->ch[0], l, mid);
o->ch[1] = merge(x->ch[1], y->ch[1], mid + 1, r);
return o->upd(), o;
}
public:
void set(int n) { this->n = n; }
void add(int id, int pos, int val) { add(root[id], 1, n, pos, val); }
std::pair<int, int> query(int id, int l, int r) { return query(root[id], 1, n, l, r); }
void merge(int x, int y) { root[x] = merge(root[x], root[y], 1, n); }
}T;
struct node {
node *ch[26], *fa;
std::vector<node *> treech;
int len;
node(int len = 0): len(len) {
memset(ch, 0, sizeof ch); fa = NULL; treech.clear();
}
}pool[maxn << 1], *tail, *lst, *root;
void init() {
tail = pool;
root = lst = new(tail++) node();
}
void extend(int c, int id) {
node *o = new(tail++) node(lst->len + 1), *v = lst;
T.add(o - pool, id, 1);
for(; v && !v->ch[c]; v = v->fa) v->ch[c] = o;
if(!v) o->fa = root;
else if(v->len + 1 == v->ch[c]->len) o->fa = v->ch[c];
else {
node *n = new(tail++) node(v->len + 1), *d = v->ch[c];
std::copy(d->ch, d->ch + 26, n->ch);
n->fa = d->fa, d->fa = o->fa = n;
for(; v && v->ch[c] == d; v = v->fa) v->ch[c] = n;
}
lst = o;
}
int f[maxn << 1][22];
void build() {
for(node *o = pool + 1; o != tail; o++) {
o->fa->treech.push_back(o);
f[o - pool][0] = o->fa - pool;
}
}
void dfs(node *o) {
for(node *to : o->treech) dfs(to), T.merge(o - pool, to - pool);
}
char s[maxn], ls[maxn];
int len, m, matchmax[maxn], matchpos[maxn];
void match() {
int nowlen = 0; node *o = root;
for(int i = 1; i <= len; i++) {
int p = s[i] - 'a';
if(o->ch[p]) o = o->ch[p], nowlen++;
else {
while(o != root && !o->ch[p]) o = o->fa, nowlen = o->len;
if(o->ch[p]) o = o->ch[p], nowlen++;
}
matchmax[i] = nowlen;
matchpos[i] = o - pool;
}
}
void getans(int ql, int qr, int l, int r) {
if(matchmax[r] < r - l + 1) return (void)(printf("%d %d\n", ql, 0));
int x = matchpos[r];
for(int i = 20; i >= 0; i--) if((pool + f[x][i])->len >= r - l + 1) x = f[x][i];
std::pair<int, int> ans = T.query(x, ql, qr);
printf("%d %d\n", ans.second, ans.first);
}
int main() {
scanf("%s", s + 1);
len = strlen(s + 1);
T.set(m = in()); init();
for(int i = 1; i <= m; i++) {
scanf("%s", ls);
lst = root;
for(char *p = ls; *p; p++) extend(*p - 'a', i);
}
build();
dfs(root);
match();
for(int j = 1; j <= 20; j++)
for(int i = 1; i <= tail - pool - 1; i++)
f[i][j] = f[f[i][j - 1]][j - 1];
int l, r, ql, qr;
for(int T = in(); T --> 0;) {
l = in(), r = in(), ql = in(), qr = in();
getans(l, r, ql, qr);
}
return 0;
}
CF666E Forensic Examination SAM+线段树合并+前缀树倍增的更多相关文章
- CF666E Forensic Examination——SAM+线段树合并+倍增
RemoteJudge 题目大意 给你一个串\(S\)以及一个字符串数组\(T[1...m]\),\(q\)次询问,每次问\(S\)的子串\(S[p_l...p_r]\)在\(T[l...r]\)中的 ...
- CF666E Forensic Examination SAM+倍增,线段树和并
题面: 给你一个串S以及一个字符串数组T[1..m],q次询问,每次问S的子串S[p_l..p_r]在T[l..r]中的哪个串里的出现次数最多,并输出出现次数.如有多解输出最靠前的那一个. 分析: 第 ...
- 2016湖南省赛 I Tree Intersection(线段树合并,树链剖分)
2016湖南省赛 I Tree Intersection(线段树合并,树链剖分) 传送门:https://ac.nowcoder.com/acm/contest/1112/I 题意: 给你一个n个结点 ...
- 208 Implement Trie (Prefix Tree) 字典树(前缀树)
实现一个 Trie (前缀树),包含 insert, search, 和 startsWith 这三个方法.注意:你可以假设所有的输入都是小写字母 a-z.详见:https://leetcode.co ...
- CF666E Forensic Examination 广义SAM、线段树合并、倍增、扫描线
传送门 朴素想法:对\(M\)个匹配串\(T_1,...,T_M\)建立广义SAM,对于每一次询问,找到这个SAM上\(S[pl...pr]\)对应的状态,然后计算出对于每一个\(i \in [l,r ...
- Codeforces 666E Forensic Examination SAM or SA+线段树合并
E. Forensic Examination http://codeforces.com/problemset/problem/666/E 题目大意:给模式串S以及m个特殊串,q个询问,询问S的子串 ...
- CF666E Forensic Examination(后缀自动机+线段树合并)
给你一个串S以及一个字符串数组T[1..m],q次询问,每次问S的子串S[pl..pr]在T[l..r]中的哪个串里的出现次数最多,并输出出现次数. 如有多解输出最靠前的那一个. 我们首先对m个字符串 ...
- CF666E Forensic Examination [后缀自动机,线段树合并]
洛谷 Codeforces 思路 最初的想法:后缀数组+区间众数,似乎并不能过. 既然后缀数组不行,那就按照套路建出广义SAM,然后把\(S\)放在上面跑,得到以每个点结尾会到SAM上哪个节点. 询问 ...
- cf666E. Forensic Examination(广义后缀自动机 线段树合并)
题意 题目链接 Sol 神仙题Orz 后缀自动机 + 线段树合并 首先对所有的\(t_i\)建个广义后缀自动机,这样可以得到所有子串信息. 考虑把询问离线,然后把\(S\)拿到自动机上跑,同时维护一下 ...
随机推荐
- Hibernate一对多操作
--------------------siwuxie095 Hibernate 一对多操作 以客户和联系人为例,客户是一,联系人是多 即 一个客户里面有多个联系人,一个联系人只能属于一个客户 注意: ...
- Web内容回顾
-----------------siwuxie095 Java EE 三层结构 1.Web 层:Struts2 框架 2.Service 层:Spring 框架 3.DAO 层:Hibernate ...
- 函数用途:同一域名对应多个IP时,获取指定服务器的远程网页内容
<?php /************************ * 函数用途:同一域名对应多个IP时,获取指定服务器的远程网页内容 * 创建时间:2008-12-09 * 创建人:张宴(img. ...
- qmake not exec in ubuntu
Description Today, I want to run qmake command in terminal, but, it has error message such qmake: co ...
- Linux buffer and cache
A buffer is something that has yet to be "written" to disk. A cache is something that has ...
- 第二话:javascript中闭包的理解
闭包是什么? 通过闭包,子函数得以访问父函数的上下文环境,即使父函数已经结束执行. OK,我来简单叙述下,先上图. 都知道函数是javascript整个世界,对象是函数,方法是函数,并且js中实质性的 ...
- C程序之包含头文件
在C程序中包含文件有以下两种方法: 方法一:#include<XXX.h> 这里的XXX一般是改动较小的标准库,用符号"<"和">"将要 ...
- mybatis 插入实体与数据库中的字段不一致的解决方案
1.建立一个实体类 public class Student { private Integer id; private String name; private Double salary; pub ...
- 设计模式13:Template Method 模板方法模式(行为型模式)
Template Method 模板方法模式(行为型模式) 变与不变 变化——是软件永恒的主题,如何管理变化带来的复杂性?设计模式的艺术性和复杂度就在于如何分析,并发现体系中的变化点和稳定点,并使用特 ...
- 【前端布局】px与rpx的简述
本文只以移动设备为例说明. 注意:设计师以iphone6为标准出设计稿的话,1rpx=0.5px=1物理像素.Photoshop里面量出来的尺寸为物理像素点.所以可以直接使用标注尺寸数据. [像素Pi ...