【字符串】BZOJ上面几个AC自动机求最为字串出现次数的题目
(一下只供自己复习用,目的是对比这几个题,所以写得不详细。需要细节的可以参考其他博主)
【BZOJ3172:单词】
题目:
某人读论文,一篇论文是由许多(N)单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。N<=200,总单词长度不超过10^6。
思路:
简单题,建立AC自动机,插入的时候每个位置都++,代表以当前位置为后缀的字符串的个数,用于fail转移时累加。然后build得到fail指针;最后从叶子向根累加。
#include<bits/stdc++.h>
using namespace std;
const int maxn=;
char c[maxn]; int ans[maxn],pos[],N;
struct Trie
{
int ch[maxn][],cnt,times,fail[maxn],q[maxn],head,tail;
Trie(){ cnt=times=head=tail=; }
int insert(){
int Now=,L=strlen(c+);
for(int i=;i<=L;i++){
if(!ch[Now][c[i]-'a']) ch[Now][c[i]-'a']=++cnt;
Now=ch[Now][c[i]-'a'];
ans[Now]++;
}
return Now;
}
void build()
{
for(int i=;i<;i++)
if(ch[][i]) q[++head]=ch[][i];
while(tail<head){
int Now=q[++tail];
for(int i=;i<;i++){
if(ch[Now][i]){
fail[ch[Now][i]]=ch[fail[Now]][i];
q[++head]=ch[Now][i];
}
else ch[Now][i]=ch[fail[Now]][i];
}
}
for(int i=tail;i>=;i--) ans[fail[q[i]]]+=ans[q[i]];
}
}T;
int main()
{
scanf("%d",&N);
for(int i=;i<=N;i++){
scanf("%s",c+);
pos[i]=T.insert();
}
T.build();
for(int i=;i<=N;i++) printf("%d\n",ans[pos[i]]);
return ;
}
【BZOJ2434阿狸的打字机】:
题目:
给定N个字符串。现在又Q个问题,每次问题给出(X,Y),求第X个字符串在第Y个字符串里出现的次数。 1<=N<=10e5;1<=M<=10e5;输入总长<=10e5
思路:
因为上一题是单次讯问,而且是整体求,所以一次拓扑倒序累加即可,但是此题是多次询问,而且是针对Trie树上代表的两个字符串X和Y之间的包含次数,不能整体法。其实问题是 “Y有多少个节点顺着fail可以走到X节点”; 正解: 1,先建立AC自动机;2,得到fail树;3,对fail树进行DFS得到DFS序;4,在Trie树上dfs求解。
#include<bits/stdc++.h>
using namespace std;
const int maxn=;
char c[maxn]; int pos[maxn],num,ans[maxn]; //记录输入字符串位置
vector<int>G[maxn]; //用于建fail树
int Laxt[maxn],Next[maxn],To[maxn],id[maxn],tot; //N个问题
void add(int u,int v,int iid) //加问题
{
Next[++tot]=Laxt[u];
Laxt[u]=tot;
To[tot]=v;
id[tot]=iid;
}
struct Trie
{
int cnt,ch[maxn][],fa[maxn],fail[maxn],q[maxn],head,tail;//建立AC自动机,fail树。
int ind[maxn],outd[maxn],times; //对Fail树DFS序部分
int sum[maxn<<]; //对Trie树dfs维护的树状数组部分
Trie(){ cnt=times=head=tail=; }
void insert(){
int Now=,L=strlen(c+);
for(int i=;i<=L;i++){
if(c[i]=='B') Now=fa[Now];
else if(c[i]=='P') pos[++num]=Now;
else {
if(!ch[Now][c[i]-'a']){
ch[Now][c[i]-'a']=++cnt;
fa[cnt]=Now;
}
Now=ch[Now][c[i]-'a'];
}
}
}
void build()
{
for(int i=;i<;i++)
if(ch[][i]){
q[++head]=ch[][i];
G[].push_back(ch[][i]);
}
while(tail<head){
int Now=q[++tail];
for(int i=;i<;i++){
if(ch[Now][i]){
fail[ch[Now][i]]=ch[fail[Now]][i];
G[fail[ch[Now][i]]].push_back(ch[Now][i]);
q[++head]=ch[Now][i];
}
else ch[Now][i]=ch[fail[Now]][i];
}
}
}
void DFS(int Now)
{
ind[Now]=++times;
int L=G[Now].size();
for(int i=;i<L;i++) DFS(G[Now][i]);
outd[Now]=++times;
}
void add(int x,int val){ while(x<=times) { sum[x]+=val; x+=(-x)&x;}}
int query(int x){ int res=; while(x){ res+=sum[x]; x-=(-x)&x;} return res;}
void dfs()
{
int Now=,L=strlen(c+);
for(int i=;i<=L;i++){
if(c[i]=='B') add(ind[Now],-) ,Now=fa[Now];
else if(c[i]=='P'){
for(int j=Laxt[Now];j;j=Next[j]){
int v=To[j];
ans[id[j]]=query(outd[v])-query(ind[v]-);
}
}
else Now=ch[Now][c[i]-'a'],add(ind[Now],);
}
}
}T;
int main()
{
scanf("%s",c+);
T.insert(); T.build();
int N,u,v; scanf("%d",&N);
for(int i=;i<=N;i++){
scanf("%d%d",&u,&v);
add(pos[v],pos[u],i);
}
T.DFS();
T.dfs(); //直接搜索是错的,需要从输入的字符串入手。因为ac自动机ch[]数组的关系是改变了的
for(int i=;i<=N;i++) printf("%d\n",ans[i]);
return ;
}
【字符串】BZOJ上面几个AC自动机求最为字串出现次数的题目的更多相关文章
- HDU 3065 病毒侵袭持续中(AC自动机(每个模式串出现次数))
http://acm.hdu.edu.cn/showproblem.php?pid=3065 题意:求每个模式串出现的次数. 思路: 不难,把模板修改一下即可. #include<iostrea ...
- bzoj 3881: [Coci2015]Divljak AC自动机
题目大意: http://www.lydsy.com/JudgeOnline/problem.php?id=3881 题解: 这道题我想出了三种做法,不过只有最后一种能过. 第一种: 首先我们把所有的 ...
- 模板—字符串—AC自动机(多模式串,单文本串)
模板—字符串—AC自动机(多模式串,单文本串) Code: #include <queue> #include <cstdio> #include <cstring> ...
- bzoj 1398: 寻找主人 AC自动机+最小表示法
题目大意: 给定两个序列判断是否循环同构,若循环同构则输出最小表示 题解: 因为没有样例输入输出,一开始没看到要求输出最小表示 Wa一大页. 但不得不说bzoj还是挺高效的: 赞一个 XD.jpg 判 ...
- HDU - 2222,HDU - 2896,HDU - 3065,ZOJ - 3430 AC自动机求文本串和模式串信息(模板题)
最近正在学AC自动机,按照惯例需要刷一套kuangbin的AC自动机专题巩固 在网上看过很多模板,感觉kuangbin大神的模板最为简洁,于是就选择了用kuangbin大神的模板. AC自动机其实就是 ...
- HDOJ-2222(AC自动机+求有多少个模板串出现在文本串中)
Keywords Search HDOJ-2222 本文是AC自动机的模板题,主要是利用自动机求有多少个模板出现在文本串中 由于有多组输入,所以每组开始的时候需要正确的初始化,为了不出错 由于题目的要 ...
- BZOJ 3172: [Tjoi2013]单词 [AC自动机 Fail树]
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3198 Solved: 1532[Submit][Status ...
- BZOJ 3881: [Coci2015]Divljak [AC自动机 树链的并]
3881: [Coci2015]Divljak 题意:添加新文本串,询问某个模式串在多少种文本串里出现过 模式串建AC自动机,考虑添加一个文本串,走到的节点记录下来求树链的并 方法是按dfs序排序去重 ...
- 字符串的模板 Manacher kmp ac自动机 后缀数组 后缀自动机
为何scanf("%s", str)不需要&运算 经常忘掉的字符串知识点,最好不加&,不加&最标准,指针如果像scanf里一样加&是错的,大概是未定 ...
随机推荐
- 自定义table样式
.tableWrap { width: 100%; border-collapse:collapse; border-top:1px solid #e9e9e9; border-left:1px so ...
- HDU 1394 线段树求逆序对
Minimum Inversion Number Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java ...
- (9)C#连mysql
1官网下载 dll 2. using MySql.Data.MySqlClient; 3. <add key="con_MES" value="server=192 ...
- json常见用法-loads、jumps、load、jump
这一篇博客的目的主要是想说明一个问题:干什么事情要抓住重点,不要力求完美,不要追求那种'大而全'的办事方式,因为时间是有限的,而客观事物(这里主要指技术方面的知识)是无限的,so,anyway! 1. ...
- Java开发笔记(一百零一)通过加解锁避免资源冲突
前面介绍了如何通过线程同步来避免多线程并发的资源冲突问题,然而添加synchronized的方式只在简单场合够用,在一些高级场合就暴露出它的局限性,包括但不限于下列几点:1.synchronized必 ...
- Android判断屏幕锁屏的方法总结
由于做一个项目,需要判断屏幕是否锁屏,发现网上方法很多,但是比较杂,现在进行总结一下: 总共有两类方法: 一.代码直接判定 二.接收广播 现在先说第一类方法(代码直接判定): 1.通过PowerMan ...
- C#对二进制文件的特定位置进行读写小结
虽然网络上关于“C#对二进制文件进行读写”的文章多如牛毛,但具体到自己要处理的问题时,难免让人产生“书到用时方恨少”和“纸上读来终觉浅”的感觉.我现在感觉要真正解决自己的问题,最终还是要靠自己下功夫. ...
- 推断dxf文件的版本号
打开DXF參考手冊,在DXF參考手冊中,点击"索引"-->输入"HEADER",在ACADVER字段有acd的版本号信息: 以下是用C语言,写的推断dxf ...
- JavaScript与Java通信
1.WebView中JavaScript调用Android程序中Java: 使用WebView类中的addJavascriptInterface()方法,能够使用它扩展嵌入式浏览器内的DOM(文档对象 ...
- hdu 4707 Pet(DFS && 邻接表)
Pet Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submis ...