第一道AC自动机题目。

记一下对AC自动机的理解吧:

AC自动机=Trie+KMP。即在Trie上应用KMP思想,实现多Pattern的匹配问题。

复杂度是预处理O(segma len(P)),匹配是O(len(T))。应该也是下界了。

它预处理做了以下事情:

  1、建立所有Pattern的Trie

  2、计算出fail和last数组

匹配时和KMP很像。

我对fail和last的理解:

  对于一棵Trie,上面的一个节点对应一个字符串,该字符串是root到该节点的路径上,边代表的字符连接起来的。

fail[i]是一个指针,它指向一个节点f,使得f代表的字符串是i代表的字符串最长的一个后缀(所以f的深度一定比i小)。

last[i]也是一个指针,它指向一个节点f,使得f代表的字符串是i代表的字符串的一个后缀且该后缀也是一个Pattern。(如果不存在则指向根)。

我们将根节点代表的字符串理解成空串,空串是任何字符串的子串。

对于匹配过程,我们将Text串也想成一个由点和边组成的链,我们从最左边的点开始向右开始匹配。

我们以Text串的位置为阶段进行匹配,如果Trie的当前节点存在一条边,使得它代表的字符串和text串一致,就两边都前进。如果不存在,trie中的节点就不断通过fail向上跳,直到存在边或到达根,如果存在边就同时向下走,否则(即到达根且根也没有对应边),那就trie保持在根,text串到下一节点。

然后每到一个新的trie节点就查看是否匹配到(要用到last数组).


去重的几种方式:

  1、set

  2、sort+unique

  3、mark+vector

各有特点,

set是实时添加和查询,O(nlogn)。

sort+unique是添加完后查询(多用于离散话),也是O(nlogn)(常数比前者小)。

mark+vector,要求范围较小(10^7以内),O(n)

 /**************************************************************
Problem: 2754
User: idy002
Language: C++
Result: Accepted
Time:1320 ms
Memory:13264 kb
****************************************************************/ #include <cstdio>
#include <cctype>
#include <queue>
#include <vector>
#include <set>
#include <map>
#include <algorithm>
#define maxn 100010
using namespace std; typedef vector<int> String; int gint() {
int rt;
char ch, opt;
while( !isdigit(ch=getchar()) ) opt=ch;
rt=ch-'';
while( isdigit(ch=getchar()) ) rt=rt*+ch-'';
return rt;
} int n, m;
int ans[][maxn];
String str[maxn], ss;
bool mark[maxn];
vector<int> in; struct AC {
map<int,int> son[maxn];
set<int> st;
vector<int> stk[maxn];
int fail[maxn], last[maxn], ntot; void insert( int id, String &p ) {
int u=;
for( int i=; i<p.size(); i++ ) {
int c=p[i];
if( !son[u][c] ) son[u][c] = ++ntot;
u=son[u][c];
}
stk[u].push_back(id);
}
void build() {
queue<int> qu;
for( map<int,int>::iterator it=son[].begin(); it!=son[].end(); ++it ) {
int v=it->second;
qu.push(v);
fail[v] = last[v] = ;
}
while(!qu.empty()) {
int u=qu.front();
qu.pop();
for( map<int,int>::iterator it=son[u].begin(); it!=son[u].end(); ++it ) {
int c=it->first;
int v=it->second;
int w=fail[u];
while( w && !son[w][c] ) w=fail[w];
int x=son[w][c];
fail[v] = x;
last[v] = stk[x].size() ? x : last[x];
qu.push(v);
}
}
}
void add( int u ) {
if( !u ) return;
add(last[u]);
for( int t=; t<stk[u].size(); t++ ) {
if( mark[stk[u][t]] ) continue;
mark[stk[u][t]] = true;
in.push_back( stk[u][t] );
}
}
void search( int id, String &T ) {
st.clear();
int u=;
for( int i=; i<T.size(); i++ ) {
while( u && !son[u][T[i]] ) u=fail[u];
u=son[u][T[i]];
if( stk[u].size() ) add(u);
else add(last[u]);
}
ans[][id] += in.size();
for( int t=; t<in.size(); t++ ) {
ans[][in[t]]++;
mark[in[t]]=false;
}
in.clear();
}
}ac; int main() {
n = gint();
m = gint();
for( int i=,z; i<=n; i++ ) {
z = gint();
while(z--) str[i].push_back( gint() );
str[i].push_back(-);
z = gint();
while(z--) str[i].push_back( gint() );
}
for( int i=,z; i<=m; i++ ) {
ss.clear();
z = gint();
while(z--) ss.push_back( gint() );
ac.insert( i, ss );
}
ac.build();
for( int i=; i<=n; i++ )
ac.search( i, str[i] );
for( int i=; i<=m; i++ )
printf( "%d\n", ans[][i] );
for( int i=; i<=n; i++ )
printf( "%d%s", ans[][i], i==n ? "" : " " );
}

bzoj 2754 ac自动机的更多相关文章

  1. bzoj 3172 AC自动机

    初学AC自动机,要先对于每一个模式串求出来trie树,在此基础上构建fail指针,然后在trie树加上失配边构建出整张trie图. AC自动机的原理和KMP差不多,一个节点的fail指针就是指向tri ...

  2. 【无聊放个模板系列】BZOJ 3172 (AC自动机)

    #include<cstdio> #include<cstdlib> #include<cstring> #include<iostream> #inc ...

  3. bzoj 2434 AC自动机+树状数组

    2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 3493  Solved: 1909[Submit][Sta ...

  4. bzoj 1030 AC自动机+dp

    代码: //先把给的单词建AC自动机并且转移fail,然后d[i][j]表示构造的文章到第i位时处在字典树的第j个节点的不包含单词的数量,最后用总的数量26^m //-d[m][0~sz]即可.其中不 ...

  5. bzoj 2434 ac自动机

    ac自动机中,如果以trie中的节点为节点,(fail[i],i)为边,可以建立一颗树,该树有如下特点:“节点u是节点v的祖先 当且仅当 u代表的字符串是v代表的字符串的一个后缀”.(u代表的字符串是 ...

  6. bzoj 1030 ac自动机

    比较容易看出来先建立ac自动机,然后在自动机上做DP,设w[0..1][i][j]为当前不包括/包括字典中的字符串,当前在自动机中走到第i个节点,完成的文本的长度为j的方案数,那么比较容易的转移w[i ...

  7. bzoj 2434 AC自动机 + fail指针建树 + 树状数组

    思路:我们先跟着它给定的字符串走把字典树建出来,求出fail指针,我们考虑两个字符串 A和B, 如果想要求B中有多少A的子串,转换一下就是有多少个B的前缀的后缀包含A,这个在AC自动机 的状态图中很容 ...

  8. bzoj 1444 AC自动机 + 矩阵乘法 | 高斯消元

    恶补了一下AC自动机,花了一天时间终于全部搞明白了. 思路:将每个人的串加入AC自动机,在AC自动机生成的状态图上建边,注意单词末尾的节点只能转移到自己概率为1, 然后将矩阵自乘几十次后误差就很小了, ...

  9. BZOJ 3940 AC自动机

    思路: 需要维护一个栈的AC自动机--. 要求出来 最后的栈顶是在自动机上的哪个节点. if(!ac.ch[st[tp-1]][a[i]-'a']) st[tp]=ac.ch[ac.f[st[tp-1 ...

随机推荐

  1. NYOJ 138 找球号(二) (哈希)

    题目链接 描述 在某一国度里流行着一种游戏.游戏规则为:现有一堆球中,每个球上都有一个整数编号i(0<=i<=100000000),编号可重复,还有一个空箱子,现在有两种动作:一种是&qu ...

  2. python 异常知识点

    raise from python 在3.0 之后引入了raise from 表达式: raise exception from otherexception 当使用该语法时,第二个表达式指定了另一个 ...

  3. Lynx以纯文本的形式下载网页

    Lynx是一款基于命令行的web浏览器 [root@test88 ~]# yum install lynx -y [root@test88 ~]# lynx www.baidu.com 以纯文本的形式 ...

  4. PHP--- JSON和数组的转换

    一.json_encode() <?php $arr =array ('a'=>1,'b'=>2,'c'=>3,'d'=>4,'e'=>5); echo json_ ...

  5. java版云笔记(四)

    页面的笔记本加载完成了,接下来就是点击笔记本显示将笔记显示,同时把笔记在右边的编辑器中,同时把编辑后的笔记更新. 注:这个项目的sql文件,需求文档,需要的html文件,jar包都可以去下载,下载地址 ...

  6. 垃圾回收算法与 JVM 垃圾回收器综述(转)

    垃圾回收算法与 JVM 垃圾回收器综述 我们常说的垃圾回收算法可以分为两部分:对象的查找算法与真正的回收方法.不同回收器的实现细节各有不同,但总的来说基本所有的回收器都会关注如下两个方面:找出所有的存 ...

  7. charles抓包误点deny处理办法及日常抓包

    误点deny方法在最底下~~ (博文为转载) 我们在开发网站项目的时候,我们可以通过浏览器的debug模式来看request以及response的数据,那么如果我们开发移动端项目没有网页呢?如何抓取数 ...

  8. 转:google测试分享-GTA

    原文: http://blog.sina.com.cn/s/blog_6cf812be0102viuh.html 上一次分享了google测试分享-分层测试,有很多自动化测试的策略和实施都要有一个重点 ...

  9. POJ 2186 Popular cows(Kosaraju+强联通分量模板)

    题目链接:http://poj.org/problem?id=2186 题目大意:给定N头牛和M个有序对(A,B),(A,B)表示A牛认为B牛是红人,该关系具有传递性,如果牛A认为牛B是红人,牛B认为 ...

  10. JAVA封装消息中间件调用二(kafka消费者篇)

    上一遍我简单介绍了kafka的生成者使用,调用方式比较简单,今天我给大家分享下封装kafka消费者,作为中间件,我们做的就是最大程度的解耦,使业务方接入我们依赖程度降到最低. 第一步,我们先配置一个消 ...