Codeforces 710F String Set Quries
题意
维护一个字符串的集合$D$, 支持3种操作:
- 插入一个字符串$s$
- 删除一个字符串$s$
- 查询一个字符串$s$在$D$中作为子串出现的次数
强制在线
解法
AC自动机+二进制分组
二进制分组
二进制分组是一种用 (套用) 离线方法解决要求强制在线问题的分块技巧. 我第一次见到它是在2013年IOI国家集训队许昊然的论文<浅谈数据结构题的几个非经典解法>中. 满足修改操作对询问的贡献独立, 修改操作之间互不影响效果 (其实前后两句说的是同一件事) 的数据结构题, 都可以采用二进制分组算法.
原理
对修改操作序列按二进制分组. 所谓"二进制", 指的是将长为$n$的修改序列按原顺序分成$k$组 (实际上是对时间分块), $k$为$n$的二进制表示中1的数目, 第$i$组的长度为第$i$个1的权重 (2的幂), 每组用一个数据结构维护. 例如, 长为10的操作序列将分成两组长度分别为 8 (1~8), 2 (9~10). 当修改序列的长度从$n$变成$n+1$时, 暴力重建变化的那些组, 不难看出需要重建的修改序列的总长度为lowbit($n+1$).
不难看出, 这个题目所涉及的操作与询问满足上述条件.
实现
二进制分组的框架:
设修改序列为vector<operation> s, 数据结构序列为 vector<structure> t.
- pop_back: 将过期的分组从队尾弹出
for(x=S.size(); x && lowbit(x)<lowbit(S.size()+1); t.pop_back(), x-=lowbit(x));
s.push_back(cur_op); // 将当前修改操作加进修改序列
- push_back: 将新建分组入队
structure cur; // 初始化为空
for(int i=s.size()-lowbit(s.size()); i<s.size(); i++) // 0-indexed
cur.insert(s[i]);
t.push_back(cur);
Implementation
本题中除了用到二进制分组意外, 还有一个巧妙的转化:
分别维护插入和删操作形成的AC-自动机组 X, Y (即把删除操作也当作插入操作), 最后结果就是在X中查询的答案减去在Y中查询的答案.
#include <bits/stdc++.h>
using namespace std;
const int N{1<<19}, M{1<<10};
typedef long long LL;
vector<string> s;
struct node{
int ch[26], fail, last, cnt;
bool f;
};
int lowbit(int x){
return x&-x;
}
queue<int> que;
struct AC{
using trie = vector<node>;
vector<trie> g; //group
vector<string> s; //string buffer
void insert(const string &t){
for(int x=s.size(); x && lowbit(x)<lowbit(s.size()+1); g.pop_back(), x-=lowbit(x)); //error-prone
g.push_back({});
auto &cur=*g.rbegin();
cur.push_back({});
s.push_back(t);
for(int i=s.size()-lowbit(s.size()); i<s.size(); i++){
int u=0;
for(auto &x:s[i]){
// int &v=cur[u].ch[x-'a']; //error
// do not use a reference to an object stored in a vector or any other dynamically allocated container,
// when it is under construction.
if(!cur[u].ch[x-'a']){
cur[u].ch[x-'a']=cur.size();
cur.push_back({});
}
u=cur[u].ch[x-'a'];
}
cur[u].cnt=1;
cur[u].f=true;
}
for(int i=0; i<26; i++){
int u=cur[0].ch[i];
if(u) que.push(u);
}
for(; que.size(); ){
int u=que.front();
que.pop();
for(int i=0; i<26; i++){
int &v=cur[u].ch[i]; //error-prone
if(v){ //v is a new node
que.push(v);
int &fail=cur[v].fail, &last=cur[v].last;
fail=cur[cur[u].fail].ch[i];
last=cur[fail].f ? fail : cur[fail].last;
cur[v].cnt+=cur[last].cnt;
// alternative: cur[v].cnt+=cur[fail].cnt;
}
else v=cur[cur[u].fail].ch[i];
}
}
}
LL match(const string &t){
LL res=0;
for(auto &cur: g){
int u=0;
for(auto &x: t){ // no need to add a const before auto
u=cur[u].ch[x-'a'];
res+=cur[u].cnt;
}
}
return res;
}
}a, b;
int main(){
int m, tail=0;
cin>>m;
string x;
for(int i=0, t; i<m; i++){
cin>>t>>x;
if(t==1){
a.insert(x);
}
else if(t==2){
b.insert(x);
}
else cout<<a.match(x)-b.match(x)<<endl;
}
}
代码中注释了我当时犯的一个不易察觉的错误.
Codeforces 710F String Set Quries的更多相关文章
- Codeforces 710F - String Set Queries(AC 自动机)
题面传送门 题意:强制在线的 AC 自动机. \(n,\sum|s|\leq 3\times 10^5\) 如果不是强制在线那此题就是道 sb 题,加了强制在线就不那么 sb 了. 这里介绍两种做法: ...
- 【Codeforces 710F】String Set Queries
Codeforces 710 F 思路:KMP学的还是不过关啊... 按照字符串的长度分类,如果长度大于\(\sqrt{n}\)的就扔到什么地方等待查询,否则就扔进trie里面. 对于查询,我们先在t ...
- CodeForces - 710F:String Set Queries (二进制分组 处理 在线AC自动机)
ou should process m queries over a set D of strings. Each query is one of three kinds: Add a string ...
- CodeForces 710F 强制在线AC自动机
题目链接:http://codeforces.com/contest/710/problem/F 题意:维护一个集合,集合要求满足三种操作. 1 str:向集合插入字符串str(保证不会插入之前已经插 ...
- Codeforces 799D. String Game 二分
D. String Game time limit per test:2 seconds memory limit per test:512 megabytes input:standard inpu ...
- Codeforces - 828C String Reconstruction —— 并查集find()函数
题目链接:http://codeforces.com/contest/828/problem/C C. String Reconstruction time limit per test 2 seco ...
- CodeForces 159c String Manipulation 1.0
String Manipulation 1.0 Time Limit: 3000ms Memory Limit: 262144KB This problem will be judged on Cod ...
- CodeForces 779D. String Game(二分答案)
题目链接:http://codeforces.com/problemset/problem/779/D 题意:有两个字符串一个初始串一个目标串,有t次机会删除初始串的字符问最多操作几次后刚好凑不成目标 ...
- Codeforces 110B-Lucky String(技能)
B. Lucky String time limit per test 2 seconds memory limit per test 256 megabytes input standard inp ...
随机推荐
- 自己写的HTML5 Canvas + Javascript五子棋
看到一些曾经只会灌水的网友,在学习了前端之后,已经能写出下载量几千几万的脚本.样式,帮助大众,成为受欢迎的人,感觉满羡慕的.我也想学会前端技术,变得受欢迎呀.于是心血来潮,开始学习前端知识,并写下了这 ...
- Dynamics CRM 之ADFS 使用 WID 和代理的联合服务器场
为此部署拓扑 Active Directory 联合身份验证服务 (AD FS) 等同于联合服务器场与 Windows 内部数据库 (WID) 拓扑中,但它将代理服务器计算机添加到外围网络,以支持外部 ...
- When I see you again(加密原理介绍,代码实现DES、AES、RSA、Base64、MD5)
关于网络安全的数据加密部分,本来打算总结一篇博客搞定,没想到东西太多,这已是第三篇了,而且这篇写了多次,熬了多次夜,真是again and again.起个名字:数据加密三部曲,前两部链接如下: 整体 ...
- AngularJS 系列 01 - HelloWorld和数据绑定
目录导读: AngularJS 系列 学习笔记 目录篇 前言: 好记性不如烂键盘,随笔就是随手笔记,希望以后有用. 本篇目录: 1. Hello World 2. AngularJS中的数据绑定 3. ...
- SQLite学习笔记(十一)&&虚拟机原理
前言 我们知道任何一种关系型数据库管理系统都支持SQL(Structured Query Language),相对于文件管理系统,用户不用关心数据在数据库内部如何存取,也不需要知道底层的存储 ...
- 树莓派 连接wifi与路由器ip绑定
先推荐几个手机软件 在酷安网里应该能找到 1.JuiceSSH 橘子ssh软件 手机连上路由器 就可以控制局域网内的树莓派 2.VNC Viewer 远程桌面软件VNC 也是连接局域网的树莓派 ...
- java中可定制的序列化过程 writeObject与readObject
来源于:[http://bluepopopo.iteye.com/blog/486548] 什么是writeObject 和readObject?可定制的序列化过程 这篇文章很直接,简单易懂.尝试着翻 ...
- Linux 查看命令源码
一.简介 有时候想看看ls.cat.more等命令的源代码,本文介绍相应查看方法. 二.方法 参考: http://blog.csdn.net/silentpebble/article/details ...
- jquery ajax在跨域访问post请求的时候,ie9以下无效(包括ie9)
1. 设置浏览器安全属性,启用[通过域访问数据源]选项,如图:
- [LeetCode] Paint Fence 粉刷篱笆
There is a fence with n posts, each post can be painted with one of the k colors. You have to paint ...