蒟蒻最近想学个AC自动机简直被网上的板子搞疯了,随便点开一个都是带指针的,然而平时用到指针的时候并不多,看到这些代码也完全是看不懂的状态。只好在大概理解后自己脑补(yy)了一下AC自动机的代码,居然还过了,这里对学到的东西做一点小小的总结。顺便造福一下跟我之前一样没有学过AC自动机并且不会用指针的Oier,给出一段不带指针的板子。

   AC自动机的模型很好理解,就是在Trie树上做类似于KMP的操作。所以说在AC自动机里也会有一个类似于 next 数组的东西------ fail 数组来作为失配指针。它指向的 目标结点所代表的字符串 是 当前结点所代表的字符串 的最长后缀。

   到这里,大概就能看出该算法的基本用途。AC自动机兼顾了 Trie树 和 KMP 的优点,多用来解决多模式串的匹配问题,即给你许多个模式串,问你这些模式串在给出的文本串里的出现情况。一般来说,AC自动机的复杂度为O(n+m),n为匹配串即文本串的长度,m为模式串的总长。在运用AC自动机时大致分为这几个步骤:建一棵 Trie树 把题目给出的模式串存入;然后建立自动机,即生成 fail 数组,一般采用 BFS 来实现这一步(在建立自动机时,我们不仅计算了 fail 数组,同时还确定了结点之间的父子关系。对于一个结点 i ,它的 fail ,即为它父亲的 fail 所对应的子结点。对于一个结点 i ,它孩子的 fail (如果该孩子在建立自动机前为空),即为 它一直失配直到找到一个存在的对应的子结点);最后一步直接将文本串放在自动机上跑就行,原理和KMP一样。

  

#include<iostream>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<algorithm>
#define il inline
#define RG register
#define N 10010
using namespace std;

char s[N][55],ss[N*100];
int n,times[N];//times记录单词在文本串中出现的次数 

struct Tri{
    int son[N][26],fail[N],root,L,num[N];

    il void init(){
        L=0; root=newnode();
        memset(fail,0,sizeof(fail));
        memset(num,0,sizeof(num));
    }

    il int newnode(){
        for( int i=0;i<26;i++ ) son[L][i] = -1;
        L++;
        return L-1;
    }

    il void insert( char s[],int v ){
        int len=strlen(s),cur=root;
        for(int i=0;i<len;i++){
            if( son[cur][s[i]-'a']==-1 )    son[cur][s[i]-'a']=newnode();
            cur=son[cur][s[i]-'a'];
        }
        num[cur]=v;    //记录该匹配串的输入编号
    }

    il void build(){   //bfs的方式来建立自动机
        queue<int>Q;
        fail[root]=root;
        for(RG int i=0;i<26;i++)
            if( son[root][i]==-1 ) son[root][i]=root;
            else{
                fail[ son[root][i] ]=root;
                Q.push( son[root][i] );
            }
        while( !Q.empty() ){
            RG int cur=Q.front();  Q.pop();
            for(RG int i=0;i<26;i++ )
                if( son[cur][i]==-1 )     son[cur][i]=son[ fail[cur] ][i];
                else{
                    fail[ son[cur][i] ]=son[ fail[cur] ][i];
                    Q.push( son[cur][i] );
                }
        }
    }

    il void query( char s[] ){
        RG int len=strlen(s),cur=root;
        for(RG int i=0;i<len;i++){
            while( cur && !son[cur][s[i]-'a'] ) cur=fail[cur];
            if( son[ cur][s[i]-'a' ] ){
                cur=son[cur][s[i]-'a'];
                RG int k=cur;
                while(k) times[ num[k] ]++,k=fail[k];
            }
        }
    }
}AC;

int main(){
    scanf("%d",&n);    AC.init();
    for(RG int i = 1;i<=n;i++){
        scanf("%s",s[i]);
        AC.insert(s[i],i);
    }
    AC.build();
    scanf("%s",ss);    AC.query(ss);
    for( RG int i=1;i<=n;i++ )    printf("%s %d\n",s[i],times[i]);
    return 0;
}

  

    最后给推荐几道简单的AC自动机的练手题:

   HDU 2222 Keywords Search(丝毫不加掩饰的板子题)

   HDU 2896 病毒侵袭

   HDU 3065 病毒侵袭持续中(注意这道题,输入有多组数据,题目中没说)

   HDU 4117 GRE Words

   HDU 4787 GRE Words Revenge

   UDH 2296 Ring

   

AC自动机总结及板子(不带指针)的更多相关文章

  1. HDU-3065 病毒侵袭持续中 AC自动机又是一板子!

    病毒侵袭持续中 上一题是求出现多少病毒输出病毒序号,而这题输出每个病毒出现的次数.这题有字典树基础都能做出来,把叶子节点用相应的编号标记起来,匹配的时候遍历到叶子节点用一个数组把次数存起来就行了. 有 ...

  2. 「笔记」AC 自动机

    目录 写在前面 定义 引入 构造 暴力 字典图优化 匹配 在线 离线 复杂度 完整代码 例题 P3796 [模板]AC 自动机(加强版) P3808 [模板]AC 自动机(简单版) 「JSOI2007 ...

  3. BZOJ2434 [Noi2011]阿狸的打字机(AC自动机 + fail树 + DFS序 + 线段树)

    题目这么说的: 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机.打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母.经阿狸研究发现,这个打字机是这样工作的: 输入小 ...

  4. 【BZOJ-2434】阿狸的打字机 AC自动机 + Fail树 + DFS序 + 树状数组

    2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2022  Solved: 1158[Submit][Sta ...

  5. 【模板】AC自动机(简单版)

    我:“woc...AC自动机?” 我:“可以自动AC???” 然鹅... 大佬:“傻...” 我:“(⊙_⊙)?” 大佬:“缺...” 我:“......” (大佬...卒 | 逃...) emm.. ...

  6. [算法模版]AC自动机

    [算法模版]AC自动机 基础内容 板子不再赘述,OI-WIKI有详细讲解. \(query\)函数则是遍历文本串的所有位置,在文本串的每个位置都沿着\(fail\)跳到根,将沿途所有元素答案++.意义 ...

  7. hdu2222 Keywords Search(AC自动机初步)

    题目大意: 给出多个模式串和一个主串,求多少个模式串在主串中出现过. 传送门 这是一道AC自动机的模板题. 在学习AC自动机之前,首先要学习WA自动机.TLE自动机和MLE自动机(雾 AC自动机是一种 ...

  8. AC自动机算法详解 (转载)

    首先简要介绍一下AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章, ...

  9. AC自动机算法小结

    AC自动机,可惜不能自动AC 转载:飘过的小牛 OIer55242 简介 Aho-Corasick automation 该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.一个常见的例子就 ...

随机推荐

  1. response.getWriter().write()产生乱码

    Struts1中通过action, return到页面的时候,如果代码中使用到response.getWriter().write(),那么有可能jsp页面中汉字会变成乱码.百度上有人说改为respo ...

  2. 在vue 中使用Stylus

    概述 什么是Stylus Stylus是一个CSS预处理器. 什么是CSS预处理器 关于CSS预处理器,推荐先行阅读这篇文章:为您详细比较三个 CSS 预处理器(框架):Sass.LESS 和 Sty ...

  3. 一步一步教你将开源项目上传到jcenter

    最近闲着看了一下jcenter的使用,也想将自己使用频率比较高的东西抽成类库,然后通过compile来使用,提高开发效率,本来以为挺简单的,但是网上介绍的比较模糊,很多博客也比较老了,不适用,花了我一 ...

  4. OpenCV探索之路(十七):Mat和IplImage访问每个像素的方法总结

    在opencv的编程中,遍历访问图像元素是经常遇到的操作,掌握其方法非常重要,无论是Mat类的像素访问,还是IplImage结构体的访问的方法,都必须扎实掌握,毕竟,图像处理本质上就是对像素的各种操作 ...

  5. OpenCV 之 神经网络 (一)

    人工神经网络(ANN) 简称神经网络(NN),能模拟生物神经系统对真实物体所作出的交互反应,是由具有适应性的简单单元(称为神经元)组成的广泛并行互连网络. 1  神经元 1.1  M-P 神经元 如下 ...

  6. 实现自己的.NET Core配置Provider之EF

    <10分钟就能学会.NET Core配置>里详细介绍了.NET Core配置的用法,另外我还开源了自定义的配置Provider:EF配置Provider和Yaml配置Provider.本文 ...

  7. CentOS通过yum安装php7.0

    一.删除旧版本 如果已经安装过php就先删除之前的版本.检查方法如下: yum list installed | grep php 然后将安装的包进行删除 比如 yum remove php.x86_ ...

  8. Unity应用架构设计(13)——日志组件的实施

    对于应用程序而言,日志是非常重要的功能,通过日志,我们可以跟踪应用程序的数据状态,记录Crash的日志可以帮助我们分析应用程序崩溃的原因,我们甚至可以通过日志来进行性能的监控.总之,日志的好处很多,特 ...

  9. [Android FrameWork 6.0源码学习] View的重绘过程

    View绘制的三部曲,  测量,布局,绘画今天我们分析测量过程 view的测量是从ViewRootImpl发起的,View需要重绘,都是发送请求给ViewRootImpl,然后他组织重绘在重绘的过程中 ...

  10. MySQL--当mysqldump --single-transaction遇到alter table

    部分生产环境采用mysqldump --single-transaction的方式在夜间进行数据库备份,而同事恰好在备份期间执行了alter table操作,操作部分成功部分失败,为啥呢? 在mysq ...