021(Keywords Search)(AC自动机)
题目:http://ybt.ssoier.cn:8088/problem_show.php?pid=1479
题目思路:一道AC自动机的模板题
备注:还不会字典树和KMP的尽早回去重修
如果让你在一篇文章里找一个单词是否出现,你会怎么做?
爆了他吗?可以,不过KMP比较省时间
然后就有人提出来了“找一堆单词”的想法
爆了他?怎么爆?弄数组吗?但是把单词存进数组里很麻烦
于是,字典树应运而生,把单词搞进树里,操作简单省时间,公共的前缀又将空间复杂度简化,实属不可多得
但这还不够,时间复杂度依旧未曾整理好,每一个单词的成功搜索都代表着新一轮字典树的重修,从根再向上爬实在是费时费力
于是有人提出了这么一个问题:能不能把字典树和KMP有机结合起来?
当我把一个单词搜干净或是确定它搜不成的时候,我就可以不往根去,而是去找另一个节点玩
那这另一个节点,我要保证他再搜索那个单词的时候就已经把这个节点和这个节点之前连着的东西找干净了,如下:
A B B H F V U D N H G B H G Y D
H G B H G Y D
所以你发现了什么吗?从根到这个节点组成的字符串,是我搜索的那个单词的后缀
那么靠着这个,我们可以得出2条原则:
1.这个单词结束后,我去的节点的深度一定不比我结束时所在的节点深,也就是我去的节点到根的距离小于等于这个节点到根的距离
不然就会出现“一个长为5的单词是一个长为4的单词的后缀”,这是什么J*B玩意
2.在保证1的情况下,这个深度要尽量的大,越大越省事
有了这两条原则,我们就可以愉快地写数组了
重新声明,Fail[i] 存的是当这个单词在 i 处结束(或是匹配成功或是失配)它会转移到 Fail[i] ,以后简称为 j 。
开始搜索:
首先,从根上分下来的第一个东西的 j 一定会往根上跑
一是它不可能有数值相同的对家,二是比它深度小的也就只有根了
然后对于后面有着两重可能
一是如果我们当前搜索的节点有儿子,那么 Fail[儿子] 就指向 Fail[它爹] 的节点与儿子数值相同的儿子
然后把这个儿子存起来,当做以后我们要搜索的节点
就算那个“数值相同的儿子”是 0 也没关系,我们让它当跳板,再往回跑就可以了
二是如果没有,就把 Fail[它爹] 的节点的数值相同的儿子指过去就可以
这个“指过去”充当了一个跳板的作用,毕竟还有一堆节点找“它爹”呢,没个儿子给他们指也就说不过去
自此,全部清零
最后一个问题:怎么计数
给每个单词的末尾加个1就可以,碰上了就加一下。
#include<bits/stdc++.h>
using namespace std;
int T,n,tot=0;
string s;
int trie[500010][26],answ[100010],nexT[500010];
//树,单词末尾计数和fail(这里起名字用的是nexT)
void putin(string s){
int p=0,l=s.size();
for(int i=0;i<l;++i){
int id=s[i]-'a';
if(!trie[p][id]){
trie[p][id]=++tot;
}
p=trie[p][id];
}//家常便饭的字典树
answ[p]++;
//计数
}
void hnext(){
queue<int> q;
//由于节点过多,整个队列会方便些
//对第一层特殊处理
for(int i=0;i<26;++i){
int g=trie[0][i];//一个一个来
if(g){//如果有东西
nexT[g]=0;//往回指根
q.push(g);//存起来
}
//如果没有就不用管了
}
while(!q.empty()){//保证有节点可搜
int t=q.front();//找到
q.pop();//扔掉
for(int i=0;i<26;++i){
int g=trie[t][i];
//g是当前节点的儿子
if(g){//有东西
q.push(g);//存起来
nexT[g]=trie[nexT[t]][i];
//儿子指儿子
}
else{//如果没有
trie[t][i]=trie[nexT[t]][i];
//也要指一下当跳板
//但不要再存了
}
}
}
}
int found(string s){
int ans=0,p=0,l=s.size();
for(int i=0;i<l;++i){
int id=s[i]-'a';
p=trie[p][id];
for(int j=p;j&&answ[j]!=-1;j=nexT[j]){
//适配或失配则回去
ans=ans+answ[j];
//慢慢加
answ[j]=-1;
//搜到了就不要再搜了
}
}
return ans;
}
int main(){
scanf("%d",&T);
while(T--){
memset(trie,0,sizeof(trie));
memset(answ,0,sizeof(answ));
memset(nexT,0,sizeof(nexT));
tot=0;
scanf("%d",&n);
for(int i=1;i<=n;++i){
cin>>s;
putin(s);
}
hnext();
cin>>s;
printf("%d\n",found(s));
}
return 0;
}
021(Keywords Search)(AC自动机)的更多相关文章
- 【HDU2222】Keywords Search AC自动机
[HDU2222]Keywords Search Problem Description In the modern time, Search engine came into the life of ...
- hdu2222 Keywords Search ac自动机
地址:http://acm.split.hdu.edu.cn/showproblem.php?pid=2222 题目: Keywords Search Time Limit: 2000/1000 MS ...
- HDU2222 Keywords Search [AC自动机模板]
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others ...
- Keywords Search(AC自动机模板)
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others ...
- HDU2222 Keywords Search —— AC自动机
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 Keywords Search Time Limit: 2000/1000 MS (Java/O ...
- Keywords Search AC自动机
In the modern time, Search engine came into the life of everybody like Google, Baidu, etc. Wiskey al ...
- Match:Keywords Search(AC自动机模板)(HDU 2222)
多模匹配 题目大意:给定很多个字串A,B,C,D,E....,然后再给你目标串str字串,看目标串中出现多少个给定的字串. 经典AC自动机模板题,不多说. #include <iostream& ...
- HDU 2222 Keywords Search(AC自动机模板题)
学习AC自动机请戳这里:大神blog........ 自动机的模板: #include <iostream> #include <algorithm> #include < ...
- hdu 2222 Keywords Search ac自动机入门
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串. ...
- HDU 2222 Keywords Search (AC自动机)
题意:就是求目标串中出现了几个模式串. 思路:用int型的end数组记录出现,AC自动机即可. #include<iostream> #include<cstdio> #inc ...
随机推荐
- 2021.12.07 P4291 [HAOI2008]排名系统(Treap)
2021.12.07 P4291 [HAOI2008]排名系统(Treap) https://www.luogu.com.cn/problem/P4291 双倍经验: https://www.luog ...
- 2021.07.26 P1022 计算器的改良(字符串)
2021.07.26 P1022 计算器的改良(字符串) 改进: 如果是我出题,我一定把未知数设为ab.buh.bluesky之类的长度不只是1的字符串! 题意: 一个一元一次方程,求解. 分析: 1 ...
- JavaScript 数学 (Math) 方法
一.Math 方法 1.Math.round(x) 的返回值是 x 四舍五入为最接近的整数: Math.round(7.8); // 返回 8 Math.round(3.3); // 返回 3 2.M ...
- 【FAQ】HMS Core广告服务:如何获取正式广告位ID以及流量变现的受限情况
HMS Core广告服务开发指南中提到"xxxx为测试专用的广告位ID,App正式发布时需要改为正式的广告位ID",那么今天咱们就来说说,怎么获取正式的广告位ID. 测试广告位ID ...
- Linux下安装并使用jumpserver跳板机
堡垒机介绍: 官方网站:https://www.jumpserver.org/ 在一个特定网络环境下,为了保障网络和数据不受外界入侵和破坏,而运用各种技术手段实时收集和监控网络环境中每一个组成部分的系 ...
- PicLite 开发日志 v0.0.2
PicLite 开发日志 (v0.0.2) 感谢您阅读本片文章! Gitee 地址:https://gitee.com/XiaoQuQuSD/pic-lite. 新增功能 添加复制 url 的格式选项 ...
- python学习-Day34
目录 今日内容详细 作业讲解 客户端 服务端 UDP协议 实现 服务器端 客户端 基于UDP实现简易版本的qq 客户端 服务器端 操作系统的发展史 第一代计算机(1940~1955) 第二代就算机(1 ...
- 《Streaming Systems》第一章: Streaming 101
数据的价值在其产生之后,将随着时间的流逝逐渐降低.因此,为了获得最大化的数据价值,尽可能实时.快速地处理新产生的数据就显得尤为重要.实时数据处理将在越来越多的场景中体现出更大的价值所在 -- 实时即未 ...
- 【问题解决】'Access-Control-Allow-Origin' header contains multiple values '*, *', but only one is allowed.
问题复述 今天项目组有人找我说之前部署的程序在测试环境没问题,到生产环境出现了奇怪的问题,点按钮没反应. 我通过腾讯会议发现他们的浏览器控制台上打出了如下错误: Access to XMLHttpRe ...
- C++基础-4-封装(构造函数与析构函数,深拷贝与浅拷贝,静态成员,this,友元,const修饰成员函数)
4. 封装 4.1.1 封装的意义 1 #include<iostream> 2 #include<string> 3 using namespace std; 4 5 con ...