并不对劲的AC自动机

这像是能解决所有问题的样子（并不）。AC自动机之所以叫AC自动机是因为它能解决所有AC自动机的题。

其实只能解决的是很多模式串匹配一个母串的问题。

把kmp中的next数组得到下一次跳转的位置看成特殊的边，把字符串看成链，就会得到一个特殊的图。

一个点u的next连向点v对应的字符串是u最长的后缀，把这个图套用到很多个模式串组成的trie上。

对于点u能走到的节点ch[u][i]，相当于在u对应的字符串后补了一个字符i。那么点u的next连向的点v对应的字符串后面再补一个字符i就是点ch[u][i]的next。有时并没有ch[v][i]，那么就要找v的next也就是更短的后缀。要是一直找不到，就只能连向0号点（空串）了。算next是一定要用bfs，不然会出现要走u的next却发现u的next还没有被算出的尴尬情况。

匹配时，如果没有ch[u][i]就要走u的next。还要注意的是，能走到u说明也能走到u的next、u的next的next、u的next的next的next等，要把这些点的值也加上。这样不会TLE吗？想必是不会的。要想知道一堆字符串中有多少个是某个串的子串，走到每个字符串结尾代表的节点时，只能统计一次。那么在统计时可以进行标记，被标记的点就不走了。又因为当一个点被标记时，它的next、它的next的next等都已经被统计过了，所以当顺着next统计的时候，发现一个被标记的点就可以停止了。自动机上的每一个点只会走到一次，所以并不会TLE。

考虑next很麻烦？当ch[u][i]==0时，令ch[u][i]=next！

#include<algorithm>

#include<cmath>

#include<cstdio>

#include<cstdlib>

#include<cstring>

#include<iomanip>

#include<iostream>

#include<map>

#include<queue>

#include<stack>

#include<vector>

#define maxn 1000010

#define rep(i,x,y) for(register int i=(x);i<=(y);i++)

#define dwn(i,x,y) for(register int i=(x);i>=(y);i--)

#define vv ch[u][i]

using namespace std;

inline int read()

{

    int x=,f=;

    char ch=getchar();

    while(isdigit(ch)== && ch!='-')ch=getchar();

    if(ch=='-')f=-,ch=getchar();

    while(isdigit(ch))x=x*+ch-'',ch=getchar();

    return x*f;

}

inline void write(int x)

{

    int f=;char ch[];

    if(!x){puts("");return;}

    if(x<){putchar('-');x=-x;}

    while(x)ch[++f]=x%+'',x/=;

    while(f)putchar(ch[f--]);

    putchar('\n');

}

int ch[maxn][],val[maxn],fail[maxn],cnt=,n,len;

char s[maxn];

int gx(char c){return c-'a';}

void build()

{

    int u=;

    rep(i,,len-)

    {

        if(!ch[u][gx(s[i])])ch[u][gx(s[i])]=++cnt;

        u=ch[u][gx(s[i])];

    }

    val[u]++;

}

void getfail()

{

    fail[]=;

    queue<int >q;

    rep(i,,)

        if(ch[][i])

            q.push(ch[][i]),

            fail[ch[][i]]=;

    while(!q.empty())

    {

        int u=q.front();q.pop();

        rep(i,,)

        {

            if(vv)

                q.push(vv),fail[vv]=ch[fail[u]][i];

            else vv=ch[fail[u]][i];

        }

    }

}

int getans()

{

    int ans=,u=;

    rep(i,,len-)

    {

        u=ch[u][gx(s[i])];

        for(int j=u;j&&val[j]!=-;j=fail[j])

            ans+=val[j],val[j]=-;

    }

    return ans;

}

int main()

{

    n=read();

    rep(i,,n)

        scanf("%s",s),len=strlen(s),build();

    getfail();

    scanf("%s",s),len=strlen(s);write(getans());

    return ;

}

#include<set>

#include<map>

#include<cmath>

#include<queue>

#include<stack>

#include<ctime>

#include<string>

#include<cstdio>

#include<vector>

#include<cstring>

#include<cstdlib>

#include<iostream>

#include<algorithm>

#define LL long long

#define MAXN 1000+1000000

#define INF 2147483647

using namespace std;

inline int read(){

    int x=,f=; char ch=getchar();

    for(;!isdigit(ch);ch=getchar())if(ch=='-')f=-;

    for(;isdigit(ch);ch=getchar())x=ch-''+(x<<)+(x<<);

    return x*f;

}

char str[MAXN];

struct ACAutomata{

    int ch[MAXN][],val[MAXN],size;

    queue<int>Q; int fail[MAXN],vis[MAXN];

    void insert(){

        int cur=,len=strlen(str);

        for(int i=;i<len;i++){

            if(ch[cur][str[i]-'a'])cur=ch[cur][str[i]-'a'];

            else ch[cur][str[i]-'a']=++size,cur=size;

        }

        val[cur]++; return ;

    }

    void calc(){

        while(!Q.empty()){

            int u=Q.front(); Q.pop();

            for(int i=;i<;i++){

                if(!ch[u][i])continue;

                int cur=fail[u]; Q.push(ch[u][i]);

                while(!ch[cur][i]&&cur)cur=fail[cur];

                fail[ch[u][i]]=ch[cur][i];

            }

        }

        return ;

    }

    int solve(){

        int cur=,ans=,len=strlen(str),pos=;

        while(pos<len){

            for(int i=cur;!vis[i]&&i!=;i=fail[i])

                ans+=val[i],vis[i]=;

            if(ch[cur][str[pos]-'a'])cur=ch[cur][str[pos]-'a'];

            else {

                cur=fail[cur];

                while(!ch[cur][str[pos]-'a']&&cur)cur=fail[cur];

                cur=ch[cur][str[pos]-'a'];

            }

            for(int i=cur;!vis[i]&&i!=;i=fail[i])

                ans+=val[i],vis[i]=; pos++;

        }

        return ans;

    }

}T;

int main(){

    int n=read();

    for(int i=;i<=n;i++){scanf("%s",str);T.insert();}

    for(int i=;i<=;i++)if(T.ch[][i])T.Q.push(T.ch[][i]);

    T.calc(); scanf("%s",str); printf("%d",T.solve());

    return ;

}

别人一般把这种并不对劲的next称为失配边、fail之类的。

刚刚说过这是一个特殊的图，因为每个点只会连出一条失配边，所有失配边也组成了一棵树。

这样树上的某些坑人操作也可以在AC自动机上做了。。。

并不对劲的AC自动机的更多相关文章

基于trie树做一个ac自动机
基于trie树做一个ac自动机 #!/usr/bin/python # -*- coding: utf-8 -*- class Node: def __init__(self): self.value ...
AC自动机-算法详解
What's Aho-Corasick automaton? 一种多模式串匹配算法,该算法在1975年产生于贝尔实验室,是著名的多模式匹配算法之一. 简单的说,KMP用来在一篇文章中匹配一个模式串:但 ...
python爬虫学习(11) —— 也写个AC自动机
0. 写在前面本文记录了一个AC自动机的诞生! 之前看过有人用C++写过AC自动机,也有用C#写的,还有一个用nodejs写的.. C# 逆袭--自制日刷千题的AC自动机攻克HDU OJ HDU 自 ...
BZOJ 2434: [Noi2011]阿狸的打字机 [AC自动机 Fail树树状数组 DFS序]
2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2545 Solved: 1419[Submit][Sta ...
BZOJ 3172: [Tjoi2013]单词 [AC自动机 Fail树]
3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3198 Solved: 1532[Submit][Status ...
BZOJ 1212: [HNOI2004]L语言 [AC自动机 DP]
1212: [HNOI2004]L语言 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 1367 Solved: 598[Submit][Status ...
[AC自动机]【学习笔记】
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)To ...
AC自动机 HDU 3065
大概就是裸的AC自动机了 #include<stdio.h> #include<algorithm> #include<string.h> #include< ...
AC自动机 HDU 2896
n个字串 m个母串字串在母串中出现几次 #include<stdio.h> #include<algorithm> #include<string.h> #inc ...

随机推荐

xtu summer individual 1 A - An interesting mobile game
An interesting mobile game Time Limit: 1000ms Memory Limit: 32768KB This problem will be judged on H ...
Python 迭代器&生成器,装饰器,递归，算法基础：二分查找、二维数组转换，正则表达式，作业：计算器开发
本节大纲迭代器&生成器装饰器基本装饰器多参数装饰器递归算法基础:二分查找.二维数组转换正则表达式常用模块学习作业:计算器开发实现加减乘除及拓号优先级解析用户输入 1 - ...
POJ1703-Find them, Catch them 并查集构造
Find them, Catch them 好久没有做并查集的题,竟然快把并查集忘完了. 题意:大致是有两个监狱,n个 ...
2016 Multi-University Training Contest 5 solutions BY ZSTU
ATM Mechine E(i,j):存款的范围是[0,i],还可以被警告j次的期望值. E(i,j) = \(max_{k=1}^{i}{\frac{i-k+1}{i+1} * E(i-k,j)+\ ...
TYVJ P 1214 硬币问题
TYVJ P 1214 硬币问题时间: 1000ms / 空间: 131072KiB / Java类名: Main 描述有n种硬币,面值为别为a[1],a[2],a[3]……a[n],每种都 ...
Gearman 初窥【转载】
Gearman是一个分发任务的程序框架,可以用在各种场合,与Hadoop相比,Gearman更偏向于任务分发功能.它的任务分布非常简单,简单得可以只需要用脚本即可完成.Gearman最初用于Live ...
hashlib-sha摘要算法模块
摘要:hashlib: 摘要算法的模块用处: 1.查看某两个文件是否完全一致 "abcdefggg" "abcdefhhg" 2.加密认证把密码加密后写入文 ...
2003 -Can't connection to mysql server on | navicat for mysql Access denied for user 'root'@''ip'(using password :yes)
用本机windows上的Navicat for mysql链接虚拟机Linux的mysql数据库时,第一次连接的时候报的错误是 2003 -Can't connection to mysql serv ...
VS2015 android 设计器不能可视化问题解决。
近期安装了VS2015,体验了一下android 的开发,按模板创建执行了个,试下效果非常不错.也能够可视化设计.但昨天再次打开或创建一个android程序后,设计界面直接不能显示,显示错误:(可能是 ...
Codeforces Round #277 (Div. 2)---C. Palindrome Transformation （贪心）
Palindrome Transformation time limit per test 1 second memory limit per test 256 megabytes input sta ...

并不对劲的AC自动机

并不对劲的AC自动机的更多相关文章

随机推荐

热门专题