HDU 2222

题意:给n个模式串和一个字符串,求有多少个模式串在这个字符串中出现

思路:裸题,注意数组开的大小

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
typedef long long LL;
const int SZ = ;
char keystr[];
int tot;
int fail[SZ], ch[SZ][], sum[SZ];
char str[];
void insert(char s[])
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'a';
if(!ch[p][c]) ch[p][c] = ++tot;
p = ch[p][c];
}
sum[p]++;
}
queue<int> q;
void getfail()
{
fail[] = ;
q.push();
while(q.size())
{
int u = q.front();
q.pop();
for(int i = ; i < ; i++)
{
if(ch[u][i])
{
if(u == ) fail[ch[u][i]] = ;
else
{
int v = fail[u];
while(v && ch[v][i] == ) v = fail[v];
fail[ch[u][i]] = ch[v][i];
}
q.push(ch[u][i]);
}
else ch[u][i] = ch[fail[u]][i];
}
}
} int match(char s[])
{
int ans = , p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'a';
while(p && ch[p][c] == ) p = fail[p];
p = ch[p][c];
int v = p;
while(sum[v] > )
{
ans += sum[v];
sum[v] = ;
v = fail[v];
}
}
return ans;
}
void init()
{
tot = ;
memset(sum, , sizeof(sum));
memset(ch, , sizeof(ch));
memset(fail, , sizeof(fail));
}
int main()
{
int T;
scanf("%d", &T);
while(T--)
{
int n;
scanf("%d", &n);
init();
for(int i = ; i < n; i++)
{
scanf("%s", keystr);
insert(keystr);
}
getfail();
scanf("%s", str);
printf("%d\n", match(str));
}
return ;
}

HDU 3065

题意:给n个模式串,一个字符串,输出在这个字符串中出现的模式串的出现次数

思路:裸题,记录idx[p] = id;//以p结尾的是第id个模式串

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
typedef long long LL;
typedef long double LD;
const int SZ = ;
char keystr[][];
int tot;
int fail[SZ];
int ch[SZ][], idx[SZ], cnt[SZ];
char str[];
void insert(char s[], int id)
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'A';
if(!ch[p][c]) ch[p][c] = ++tot;
p = ch[p][c];
}
idx[p] = id;//以p结尾的是第id个模式串
}
queue<int> q;
void getfail()
{
fail[] = ;
q.push();
while(q.size())
{
int u = q.front();
q.pop();
for(int i = ; i < ; i++)
{
if(ch[u][i])
{
if(u == ) fail[ch[u][i]] = ;
else
{
int v = fail[u];
while(v && ch[v][i] == ) v = fail[v];
fail[ch[u][i]] = ch[v][i];
}
q.push(ch[u][i]);
}
else ch[u][i] = ch[fail[u]][i];
}
}
} void match(char s[])
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'A';
if(s[i] < 'A' || s[i] > 'Z') c = ;
while(p && ch[p][c] == ) p = fail[p];
p = ch[p][c];
int v = p;
while(v)
{
if(idx[v] > ) cnt[idx[v]]++;
v = fail[v];
}
}
} void init()
{
tot = ;
memset(cnt, , sizeof(cnt));
memset(ch, , sizeof(ch));
memset(fail, , sizeof(fail));
memset(idx, , sizeof(idx));
}
int main()
{
int n;
while(~scanf("%d", &n))
{
init();
for(int i = ; i <= n; i++)
{
scanf("%s", keystr[i]);
insert(keystr[i], i);
}
getfail();
scanf("%s", str);
match(str);
for(int i = ; i <= n; i++)
if(cnt[i]) printf("%s: %d\n", keystr[i], cnt[i]);
}
return ;
}

ZOJ 3228

题意:给n个模式串,一个字符串,分别求每个模式串在字符串中出现的次数,其中输入中0表示可以覆盖着出现,1表示不能

思路:如果没有1那种情况就是裸题,1的情况下

用last[i]记录Trie节点i在上一次匹配时所对应的字符在文本串中的位置。

用pos[i]记录Trie节点i所对应的字符在模式串中的位置。

没有重叠的判断 —— 当前字符位置 - last[当前节点] >= pos[当前节点]。

abababac - aba

pos[1] = 1  pos[2] = 2  pos[3] = 3

i = 4时,last[3] = 2 pos[3] = 3 而i - last[3] < pos[3] 所以不行

3再往前到1,last[1] = 2 pos[1] = 1 可以了,然后last[1] = 4,节点1匹配到了文本串中的第4位

太高端了。。。。

卡数组大小,记得开n*len的

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
typedef long long LL;
typedef long double LD;
const int SZ = ;
char keystr[];
int tot;
int fail[SZ];
int ch[SZ][], idx[SZ], cnt[][SZ];
int last[SZ], pos[SZ], typ[SZ];
char str[];
void insert(char s[], int id)
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'a';
if(!ch[p][c]) ch[p][c] = ++tot;
p = ch[p][c];
pos[p] = i+;
}
idx[id] = p;
}
queue<int> q;
void getfail()
{
fail[] = ;
q.push();
while(q.size())
{
int u = q.front();
q.pop();
for(int i = ; i < ; i++)
{
if(ch[u][i])
{
if(u == ) fail[ch[u][i]] = ;
else
{
int v = fail[u];
while(v && ch[v][i] == ) v = fail[v];
fail[ch[u][i]] = ch[v][i];
}
q.push(ch[u][i]);
}
else ch[u][i] = ch[fail[u]][i];
}
}
} void match(char s[])
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = s[i] - 'a';
p = ch[p][c];
int v = p;
while(v)
{
cnt[][v]++;
if(i - last[v] >= pos[v])
{
cnt[][v]++;
last[v] = i;
}
v = fail[v];
}
}
} void init()
{
tot = ;
memset(cnt, , sizeof(cnt));
memset(ch, , sizeof(ch));
memset(last, -, sizeof(last));
memset(pos, , sizeof(pos));
}
int main()
{
int n, tt = ;
while(~scanf("%s", str))
{
init();
scanf("%d", &n);
for(int i = ; i < n; i++)
{
scanf("%d %s", &typ[i], keystr);
insert(keystr, i);
}
getfail();
match(str);
printf("Case %d\n", ++tt);
for(int i = ; i < n; i++)
printf("%d\n", cnt[typ[i]][idx[i]]);
printf("\n");
}
return ;
}

HDU 2457 AC自动机+DP

题意:给n种病毒序列(只含ACGT),给一串基因,为最少修改多少个碱基(?)能使得其中不含病毒,如果不能做到则输出-1

思路:考虑神仙DP

f[i][j] 表示文本串的前 i 个字符,处于 Trie 图的节点 j 且不 经过终止节点(危险节点)的最少修改个数

每个点的是否是终止节点:如果它或它顺着 fail 函数能达到 的点中有一个是终止节点,那么它也是终止节点

这个讲的蛮明白的:https://blog.csdn.net/human_ck/article/details/6577142

转移方程:dp[i+1][ch[p][j]] = min(dp[i+1][ch[p][j]], dp[i][p] + (j == c ? 0 : 1)); //j表示枚举把这个非危险节点的点修改成什么,如果和原来相同则操作数不变,如果不同则+1

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
typedef long long LL;
const int SZ = ;
const int INF = ;
char keystr[];
int tot;
int fail[SZ];
int ch[SZ][], dp[][SZ];
char str[];
bool flag[SZ];
int tran(char c)
{
if(c == 'A') return ;
if(c == 'G') return ;
if(c == 'C') return ;
if(c == 'T') return ;
}
void insert(char s[])
{
int p = ;
int len = strlen(s);
for(int i = ; i < len; i++)
{
int c = tran(s[i]);
if(!ch[p][c]) ch[p][c] = ++tot;
p = ch[p][c];
}
flag[p] = true;
}
queue<int> q;
void getfail()
{
fail[] = ;
q.push();
while(q.size())
{
int u = q.front();
q.pop();
for(int i = ; i <= ; i++)
{
if(ch[u][i])
{
if(u == ) fail[ch[u][i]] = ;
else
{
int v = fail[u];
while(v && ch[v][i] == ) v = fail[v];
fail[ch[u][i]] = ch[v][i];
}
if(flag[fail[ch[u][i]]]) flag[ch[u][i]] = true;
q.push(ch[u][i]);
}
else ch[u][i] = ch[fail[u]][i];
}
}
} void match(char s[])
{
int p = ;
int len = strlen(s);
for(int i = ; i <= len; i++)
for(int j = ; j <= tot; j++)
dp[i][j] = INF;
dp[][] = ;
for(int i = ; i < len; i++)
{
int c = tran(s[i]);
for(p = ; p <= tot; p++)
{
if(dp[i][p] == INF) continue;
for(int j = ; j <= ; j++)
{
if(flag[ch[p][j]]) continue;
dp[i+][ch[p][j]] = min(dp[i+][ch[p][j]], dp[i][p] + (j == c ? : ));
}
}
}
} void init()
{
tot = ;
memset(ch, , sizeof(ch));
memset(fail, , sizeof(fail));
memset(flag, false, sizeof(flag));
}
int main()
{
int n, tt = ;
while(scanf("%d", &n) && n)
{
init();
for(int i = ; i <= n; i++)
{
scanf("%s", keystr);
insert(keystr);
}
getfail();
scanf("%s", str);
int len = strlen(str);
match(str);
int minn = INF;
for(int i = ; i <= tot; i++)
if(!flag[i]) minn = min(minn, dp[len][i]);
if(minn == INF) minn = -;
printf("Case %d: %d\n", ++tt, minn);
}
return ;
}

OTZ

暑假集训 || AC自动机的更多相关文章

  1. 【集训第二天·翻水的老师】--ac自动机+splay树

    今天是第二天集训.(其实已经是第三天了,只是昨天并没有机会来写总结,现在补上) 上午大家心情都很愉快,因为老师讲了splay树和ac自动机. 但到了下午,我们的教练竟然跑出去耍了(excuse me? ...

  2. 【暑假】[实用数据结构] AC自动机

    Aho-Corasick自动机  算法: <功能> AC自动机用于解决文本一个而模板有多个的问题. AC自动机可以成功将多模板匹配,匹配意味着算法可以找到每一个模板在文本中出现的位置. & ...

  3. 暑假集训(2)第七弹 -----今年暑假不AC(hdu2037)

    J - 今年暑假不AC Crawling in process... Crawling failed Time Limit:1000MS     Memory Limit:32768KB     64 ...

  4. 今年暑假不AC - HZNU寒假集训

    今年暑假不AC "今年暑假不AC?" "是的." "那你干什么呢?" "看世界杯呀,笨蛋!" "@#$%^&a ...

  5. 2015UESTC 暑假集训总结

    day1: 考微观经济学去了…… day2: 一开始就看了看一道题目最短的B题,拍了半小时交了上去wa了 感觉自己一定是自己想错了,于是去拍大家都过的A题,十分钟拍完交上去就A了 然后B题写了一发暴力 ...

  6. 字符串处理-AC自动机

    估计在OJ上刷过题的都会对AC自动机这个名词很感兴趣,同样,记得去年ACM暑期集训的时候,在最后讲到字符串部分,听说了这个算法的名字之后就对于它心向往之,AC正好是Accept的简称,字面意义上的理解 ...

  7. 「LuoguP3808」 【模板】AC自动机(简单版)

    题目背景 通过套取数据而直接“打表”过题者,是作弊行为,发现即棕名. 这是一道简单的AC自动机模板题. 用于检测正确性以及算法常数. 为了防止卡OJ,在保证正确的基础上只有两组数据,请不要恶意提交. ...

  8. 【模版 Luogu P3808/P3796/P5357】AC自动机(简论)

    浙江集训Day9,没有出任何实质性成果,只好把昨天打完的板子记一下. 该博客基于luogu的三道模版题.只有一个大致的讲解,主要提供代码给自己参考. ------------------------- ...

  9. 基于trie树做一个ac自动机

    基于trie树做一个ac自动机 #!/usr/bin/python # -*- coding: utf-8 -*- class Node: def __init__(self): self.value ...

随机推荐

  1. nodejs 全局对象 global

    nodejs中有一个全局对象 global,所有的全局变量都是global对象的属性,glabal最根本的作用是作为全局变量的宿主, 全局变量: 1 在最外层定义的变量 2 全局对象的属性 3 隐式定 ...

  2. 004--linux命令tar 软硬链接

    一.tar命令介绍: -c:创建一个新的tar文件 -t:列出tar文件中目录的内容 -x:从tar文件中抽取文件 -f:指定归档文件或磁带(也可能是软盘)设备(一般都要选) -v:显示所打包的文件的 ...

  3. hdoj5387【模拟】

    题意: 略: 思路: 把所有的角度按照分母的形式写,中间不要约,不要除...(然后我就wa了),本来是想保证结果的正确性,最后会造成约好以后分子很大..>360°: /* 这个案例不错,妈的,随 ...

  4. 洛谷 P3960 列队【线段树】

    用动态开点线段树分别维护每一行和最后一列,线段树的作用是记录被选的点的个数以及查询第k个没被选的点,每次修改,从行里标记被选的点,从最后一列标记向左看齐之后少的点,然后用vector维护行列的新增点 ...

  5. 【Tip】JavaScript

    『JavaScript』 『引用网络资源』 JQuery <script src="http://code.jquery.com/jquery-latest.js">& ...

  6. 树链剖分学习笔记 By cellur925

    先%一发机房各路祖传树剖大师%%%. 近来总有人向我安利树剖求LCA,然鹅我还是最爱树上倍增.然鹅又发现近年一些题目(如天天爱跑步.运输计划等在树上进行操作的题目),我有把树转化为一条链求解的思路,但 ...

  7. 给Clouderamanager集群里安装可视化分析利器工具Hue步骤(图文详解)

    扩展博客 以下,是我在手动的CDH版本,安装Hue. CDH版本大数据集群下搭建Hue(hadoop-2.6.0-cdh5.5.4.gz + hue-3.9.0-cdh5.5.4.tar.gz)(博主 ...

  8. java sevlet Session

    * 如果浏览器支持Cookie,创建Session的时候会把SessionId保存在Cookie中 * 否则必须自己编程使用URL重写的方式实现Session:response.encodeURL()

  9. flask跨域问题

    在Flask开发RESTful后端时,前端请求会遇到跨域的问题.下面是解决方法: 使用 flask-cors库可以很容易的解决   1 pip install flask-cors 两种方法,一个是全 ...

  10. Hdu 4513 吉哥系列故事——完美队形II (manacher变形)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4513 题目描述: 打完题目描述了,点开题目,发现题目是中文,orz.jpg.果断又删掉了,习惯真可怕 ...