AC自动机是一个多模字符串匹配的自动机(网上说的),主要作用是在一个长串中同时进行多个字符串的匹配

基础芝士:

trie树(字典树)

烤馍片kmp单模字符串匹配

如果不会的建议去网上学一下(本篇讲解略过)

这里重点讲一讲AC自动机

(由于本蒟蒻不会指针,所以所有算法一律不使用指针,请神犇们谅解)

例:luogu3796 AC自动机(加强版)

其实AC自动机就是在trie树上构造KMP的next指针(在AC自动机中叫fail指针),然后进行匹配

举个例子:

模式串:

abab

abb

bab

匹配串:

aaabbbabababbba

AC自动机第一步:建立trie树!

建树过程略,反正建起的树长这样:

建树代码如下,基本和trie树代码接近:

void buildtree(char *p)
{
int l=strlen(p);
int now=0;
for(int i=0;i<l;i++)
{
int t=p[i]-'a'+1;
if(tree[now].to[t]==0)
{
tree[now].to[t]=++cnt;
tree[tree[now].to[t]].fa=now;
tree[tree[now].to[t]].ca=t;
}
now=tree[now].to[t];
}
tree[now].ed++;
}

接下来我们考虑构造fail指针

fail指针的含义其实就是:如果在这一位上失配了,那么整个串不必从头开始,而是直接从中间的某处开始继续在失配处匹配即可

由于这是一棵trie树,所以我们可以考虑基于bfs进行构造

首先,如果一开始就失配,那就没啥可说的了,直接返回最大的根节点,所以在构造trie树时一般从1开始,0作为虚节点为根

代码如下:

queue <int> M;
for(int i=1;i<=26;i++)
{
if(tree[0].to[i])
{
M.push(tree[0].to[i]);
tree[tree[0].to[i]].fall=0;
}
}

接下来,我们就可以进行bfs了

这里也是整个AC自动机中最复杂的地方

对于每个点,我们枚举他的每一个to指针,然后分类讨论:

①:这个to节点存在

(什么叫存在?比如上面的trie树,根据字符集来讲,每个节点都应该有两个儿子,可是事实上大部分节点都只有一个儿子,那么有的这个儿子就叫存在,没有就叫不存在)

那么,这个to的fail指针应该指向他父节点的fail指针指向节点所指向的对应的to(读二十遍)

先放代码,再解释,否则不好懂

if(tree[u].to[i])
{
tree[tree[u].to[i]].fall=tree[tree[u].fall].to[i];
M.push(tree[u].to[i]);
}

解释一下,就像这样:

其中蓝色的线为fail指针

发现什么了吗?

一个点fail指针所指向的点所在字符串的前缀一定是这个点所在字符串的子串!

举个例子:

如图所示,右边红色框里的字符串的前缀是左边红色字符串的一个子串,因为左边的b指向了右边的b

(当然,这个前缀理论仅适用于fail指针指向的节点之前的前缀,而之后的是无法保证的)

但是我们会发现一个bug:看到第二个串的最后一个b了吗?他的fail指针应该指向他父节点的fail指针指向节点的对应节点,可是..没有这个节点啊...

直接指回根节点?

这不太好

因为明明有能匹配上的啊

所以我们要利用trie图思想了。

trie图与AC自动机少数的不同就是trie图会补全所有的子节点,补全方法是指向这个点父节点的fail指针指向节点的对应节点

else
{
tree[u].to[i]=tree[tree[u].fall].to[i];
}

所以这也就是上面所述的分类讨论的第二种情况:如果这个节点不存在,那么要把这个节点的指针建起来

这样就可以指了

最后构造好的fail指针长这样:

其中绿色的是特殊构造出来的fail指针

fail指针都完事了,接下来就好办了。

我们将模式串在这个AC自动机上跑

查询操作:

int query(char *p)
{
int l=strlen(p);
int ans=0;
tot=0;
int now=0;
for(int i=0;i<l;i++)
{
int t=p[i]-'a'+1;
now=tree[now].to[t];
int temp=now;
while(temp)
{
if(tree[temp].ed>ans)
{
memset(ret,0,sizeof(ret));
tot=0;
ret[++tot]=temp;
ans=tree[temp].ed;
}else if(tree[temp].ed==ans)
{
ret[++tot]=temp;
}
if(tree[temp].ed)
{
tree[temp].ed++;
}
temp=tree[temp].fall;
}
}
return ans;
}

稍微解释一下,就是顺着trie树跑匹配串,根据上文所述fail指针的性质,每次向前找一个前缀使得这个前缀是这个匹配串的子串,于是我们总是能找到整个串是这个字符串的子串

还有一步操作很重要,即上面的最后一个if,这一步的操作目的在于累计某个串被匹配上的次数

这样就完事了

贴代码:

#include <cstdio>
#include <cmath>
#include <cstring>
#include <cstdlib>
#include <iostream>
#include <algorithm>
#include <queue>
#include <stack>
using namespace std;
struct Trie
{
int to[27];
int fa;
int fall;
int ca;
int ed;
}tree[1000005];
int ret[155];
char s[1000005];
int cnt=0;
int tot=0;
void buildtree(char *p)
{
int l=strlen(p);
int now=0;
for(int i=0;i<l;i++)
{
int t=p[i]-'a'+1;
if(tree[now].to[t]==0)
{
tree[now].to[t]=++cnt;
tree[tree[now].to[t]].fa=now;
tree[tree[now].to[t]].ca=t;
}
now=tree[now].to[t];
}
tree[now].ed++;
}
void getfail()
{
queue <int> M;
for(int i=1;i<=26;i++)
{
if(tree[0].to[i])
{
M.push(tree[0].to[i]);
tree[tree[0].to[i]].fall=0;
}
}
while(!M.empty())
{
int u=M.front();
M.pop();
for(int i=1;i<=26;i++)
{
if(tree[u].to[i])
{
tree[tree[u].to[i]].fall=tree[tree[u].fall].to[i];
M.push(tree[u].to[i]);
}else
{
tree[u].to[i]=tree[tree[u].fall].to[i];
}
}
}
}
int query(char *p)
{
int l=strlen(p);
int ans=0;
tot=0;
int now=0;
for(int i=0;i<l;i++)
{
int t=p[i]-'a'+1;
now=tree[now].to[t];
int temp=now;
while(temp)
{
if(tree[temp].ed>ans)
{
memset(ret,0,sizeof(ret));
tot=0;
ret[++tot]=temp;
ans=tree[temp].ed;
}else if(tree[temp].ed==ans)
{
ret[++tot]=temp;
}
if(tree[temp].ed)
{
tree[temp].ed++;
}
temp=tree[temp].fall;
}
}
return ans;
}
bool cmp(int a,int b)
{
return a<b;
}
void init()
{
memset(ret,0,sizeof(ret));
memset(tree,0,sizeof(tree));
cnt=0;
tot=0;
}
void print(int rt)
{
if(!rt)
{
return;
}
print(tree[rt].fa);
printf("%c",tree[rt].ca-1+'a');
}
int main()
{
int n;
while(1)
{
scanf("%d",&n);
if(n==0)
{
return 0;
}
init();
for(int i=1;i<=n;i++)
{
scanf("%s",s);
buildtree(s);
}
getfail();
scanf("%s",s);
printf("%d\n",query(s));
sort(ret+1,ret+tot+1,cmp);
for(int i=1;i<=tot;i++)
{
print(ret[i]);
printf("\n");
}
}
return 0;
}

AC自动机(trie图版)的更多相关文章

  1. 【AC自动机&&Trie图】积累

    以前KMP和后缀系列(主要是后缀数组,后缀自动机),都刷了一定数量的题,但是对于AC自动机,却有些冷落,罪过. 但是我感觉,在蓝桥杯比赛中AC自动机出现的概率比后缀系列大,简单的会考匹配,稍难一点会考 ...

  2. 小菜鸟 菜谈 KMP->字典树->AC自动机->trie 图 (改进与不改进)

    本文的主要宗旨是总结自己看了大佬们对AC自动机和trie 图 的一些理解与看法.(前沿:本人水平有限,总结有误,希望大佬们可以指出) KMP分割线--------------------------- ...

  3. AC自动机讲解

    今天花了半天肝下AC自动机,总算啃下一块硬骨头,熬夜把博客赶出来.. 正如许多博客所说,AC自动机看似很难很妙,而事实上不难,但的确很妙.笼统地说,AC自动机=Trie+KMP,但是仅仅知道这个并没有 ...

  4. 洛谷P2444 [POI2000]病毒(AC自动机,DFS求环)

    洛谷题目传送门 AC自动机入门--yyb巨佬的博客 AC自动机入手经典好题(虽然年代久远) 有了fail指针,trie树就不是原来的树型结构了,我们可以把它叫做trie图,由父节点向子节点连的边和fa ...

  5. 「AC自动机」学习笔记

    AC自动机(Aho-Corasick Automaton),虽然不能够帮你自动AC,但是真的还是非常神奇的一个数据结构.AC自动机用来处理多模式串匹配问题,可以看做是KMP(单模式串匹配问题)的升级版 ...

  6. BZOJ1559[JSOI2009]密码——AC自动机+DP+搜索

    题目描述 输入 输出 样例输入 10 2 hello world 样例输出 2 helloworld worldhello 提示 这题算是一个套路题了,多个串求都包含它们的长为L的串的方案数. 显然是 ...

  7. 【模板】AC自动机(简单版)

    我:“woc...AC自动机?” 我:“可以自动AC???” 然鹅... 大佬:“傻...” 我:“(⊙_⊙)?” 大佬:“缺...” 我:“......” (大佬...卒 | 逃...) emm.. ...

  8. bzoj 2754 ac自动机

    第一道AC自动机题目. 记一下对AC自动机的理解吧: AC自动机=Trie+KMP.即在Trie上应用KMP思想,实现多Pattern的匹配问题. 复杂度是预处理O(segma len(P)),匹配是 ...

  9. AC自动机--summer-work之我连模板题都做不出

    这章对现在的我来说有点难,要是不写点东西,三天后怕是就一无所有了. 但写这个没有营养的blog的目的真的不是做题或提升,只是学习学习代码和理解一些概念. 现在对AC自动机的理解还十分浅薄,这里先贴上目 ...

随机推荐

  1. 面向对象【day08】:问答式面相对象(四)

    本节内容 1.什么是面向对象编程 2.什么是市类?什么是对象?又有什么关系? 3.什么时候适用面向对象? 4.self就是调用当前方法的对象 5.封装.继承.多态 6.字段方法 1.什么是面向对象编程 ...

  2. python---生成验证码图片

    工具插件verifycode.py中,记得使用时需要在路由根目录中引入文字资源文件 # coding:utf8 # __author: Administrator # date: // # /usr/ ...

  3. Java 编程下使用 Class.forName() 加载类【转】

    在一些应用中,无法事先知道使用者将加载什么类,而必须让使用者指定类名称以加载类,可以使用 Class 的静态 forName() 方法实现动态加载类.下面的范例让你可以指定类名称来获得类的相关信息. ...

  4. C#常用的正则工具类写法

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...

  5. 简述var、let、const三者的区别

    前二者为定义变量,const一般用来定义常量. 1.var声明变量可以重复声明,而let不可以重复声明 var name = 'xiaohuang'; var name = 'xiaolan'; co ...

  6. JAVA 动态代理学习记录

    打算用JAVA实现一个简单的RPC框架,看完RPC参考代码之后,感觉RPC的实现主要用到了两个方面的JAVA知识:网络通信和动态代理.因此,先补补动态代理的知识.---多看看代码中写的注释 参考:Ja ...

  7. 20155319 2016-2017-2 《Java程序设计》第八周学习总结

    20155319 2016-2017-2 <Java程序设计>第八周学习总结 教材学习内容总结 NIO与NIO2 - NIO使用频道(channel)来衔接数据节点 - read()将Re ...

  8. NOIP2016 D2-T3 愤怒的小鸟

    看了题解之后知道,是状压dp. 一.首先预处理一个$2^n$次方的fpow[]数组 fpow[]=; ;i<=;i++)fpow[i]=(fpow[i-]<<); 二.然后预处理一个 ...

  9. Android常用网络请求框架Volley Retrofit (okHttp)

    Android系统中主要提供了两种方式来进行HTTP通信,HttpURLConnection和HttpClient.在 Android 5.0 的时候 Google 就不推荐使用 HttpClient ...

  10. Struts S2-052漏洞利用

    昨天在FreeBuf上看到[9月6日更新]漏洞预警 | 高危Struts REST插件远程代码执行漏洞(S2-052) 然而一直复现不了,今天又试了下竟然成功了. 由于水表查的较严,就不冒险搞别人的服 ...