感觉不把这个Trie理解一下,AC自动机的代码看起来有点费劲。

这里代码的学习仿照训练指南209页。

这里如果只是查询单词,感觉用map更好,但是如果查前缀,还是用Trie。

1、Trie查询前缀字符串是否存在。

 #include <bits/stdc++.h>
using namespace std;
#define mst(s,v) memset(s, v, sizeof(s));
const int maxnode = ;
const int sigma_size = ;
//字母表为全体小写字母的Trie
struct Trie{
int ch[maxnode][sigma_size];
int val[maxnode];
int sz; //结点总数
Trie(){ sz=; mst(ch[], ); mst(val, ); } //初始时只有一个根节点
int idx(char c) { return c-'a'; }
//插入字符串s,附加信息为v。v!=0(0代表本身不是单词结点)
void insert(char *s, int v){
int u = , n = strlen(s);
for(int i=; i<n; i++){
int c = idx(s[i]);
if(!ch[u][c]){ //结点不存在
memset(ch[sz], , sizeof(ch[sz]));
val[sz] = ; //中间结点的附加信息为0
ch[u][c] = sz++;
}
u = ch[u][c];
}
val[u] = v; //字符串的最后一个字符的附加信息
//标记在末结点,查询整个单词时有用
}
bool find(char *s){
int u = , len = strlen(s);
for(int i=; i<len; i++){
int c = idx(s[i]);
if(!ch[u][c]) return false;
u = ch[u][c];
}
return true; //查询整个单词时 return val[u]
}
}tree;
int main(){
freopen("in.txt", "r", stdin);
int n, m;
cin >> n >> m;
char tmp[];
for(int i=; i<n; i++){
cin >> tmp;
cout << tmp << endl;
tree.insert(tmp, );
}
for(int i=; i<m; i++){
cin >> tmp;
cout << endl << tmp << endl;
if(tree.find(tmp)) cout << "Y" << endl;
else cout << "N" << endl;
}
return ;
}
/*
6 2
shex
shexy
yasherhs
say
shrxy
sher
yasherhs
she
*/

2、Trie查询前缀个数

 #include <bits/stdc++.h>
using namespace std;
#define mst(s,v) memset(s, v, sizeof(s));
const int maxnode = ;
const int sigma_size = ;
//可以查找前缀,也可以查找单词(map)
struct Trie{
int ch[maxnode][sigma_size];
int sum[maxnode];
int sz; //结点总数
Trie(){ sz=; mst(ch[], ); mst(sum, ); }
int idx(char c) { return c-'a'; }
//插入字符串s,附加信息为v。v!=0(0代表本身不是单词结点)
void insert(char *s){
int u = , n = strlen(s);
for(int i=; i<n; i++){
int c = idx(s[i]);
if(!ch[u][c]){ //结点不存在
memset(ch[sz], , sizeof(ch[sz]));
ch[u][c] = sz++;
}
sum[ch[u][c]]++;
u = ch[u][c];
}
}
int find(char *s){
int u = , len = strlen(s);
for(int i=; i<len; i++){
int c = idx(s[i]);
if(!ch[u][c]) return ;
u = ch[u][c];
}
return sum[u];
}
}tree;
int main(){
freopen("in.txt", "r", stdin);
int n, m;
cin >> n >> m;
char tmp[];
for(int i=; i<n; i++){
cin >> tmp;
tree.insert(tmp);
}
for(int i=; i<m; i++){
cin >> tmp;
cout << tmp << endl;
cout << tree.find(tmp) << endl;
}
return ;
}

3、用指针理解Trie

#include <bits/stdc++.h>
using namespace std;
#define mst(s,v) memset(s, v, sizeof(s));
const int sigma_size = ;
struct node{
int count;
node * next[];
}*root;
int idx(char c){ return c-'a'; }
node* build(){
node* k = new(node);
k->count = ;
mst(k->next , );
return k;
}
void insert(char* s){
node* r = root;
char* word = s;
while(*word){
int c = idx(*word);
if(r->next[c] == NULL) r->next[c] = build();
r = r->next[c];
r->count++;
word++;
}
}
int find(char* s){
node* r = root;
char* word = s;
while(*word){
int c = idx(*word);
r = r->next[c];
if(r==NULL) return ;
word++;
}
return r->count;
}
int main(){
freopen("in.txt", "r", stdin);
int n, m;
cin >> n >> m;
char tmp[];
root = build();
for(int i=; i<n; i++){
cin >> tmp;
insert(tmp);
}
for(int i=; i<m; i++){
cin >> tmp;
cout << tmp << endl;
cout << find(tmp) << endl;
}
return ;
}

Trie灵活的地方是在插入时对点的属性的更新,以及查询时与其他算法的结合。

这里将AC自动机summer-work那里的C - L语言拿过来,感受在查询变化的一些思路。

题意:n(1,20)模式串(可以有包含关系(这就决定了不能贪心)),m(1,20)文本串,对每个文本串,n个模式串最多可以组成的最长前缀的位置。

这题就是在find()上思考解法,正解应该是dp[i]是否能理解前i个单词,这里因为是学习Trie,所以就暴力吧(感觉自己太水)。

这里总结一个套路,因为是单词而非前缀,所以insert()时点的属性是val=1。

为了创造vis(是否理解前i个单词)的边界条件vis[0]=v(明显可以识别),所以这里scanf(s+1),即遍历时从i+1开始。

 #include <bits/stdc++.h>
using namespace std;
#define mst(s,v) memset(s, v, sizeof(s));
const int maxnode = ;
const int sigma_size = ;
const int maxlen = 1e6 + 5e4;
int dp[maxlen];
struct Trie{
int ch[maxnode][sigma_size];
int val[maxlen];
int sz;
Trie(){ sz=; }
inline int idx(char c) { return c-'a'; }
inline void insert(char *s){
int u = , n = strlen(s);
for(int i=; i<n; i++){
int c = idx(s[i]);
if(!ch[u][c]){
ch[u][c] = sz++;
}
u = ch[u][c];
}
val[u] = ; //标记单词
}
inline int find(char *s, int v){
int u = , len = strlen(s), ans = ;
dp[] = v; //标记能够被识别的前缀位置
for(int i=; i<len; i++){
if(dp[i] == v){
u = ;
for(int j=i+; j<len; j++){
int c = idx(s[j]);
if(!ch[u][c]) break;
//cout<<"u = "<<u<<" v = "<<v<<" s[j] = "<<s[j]<<endl;
u = ch[u][c];
if(val[u]){ //找到单词的前缀
ans = max(ans, j);
dp[j] = v; //标记位置
}
}
}
}
return ans;
}
}tree;
char tmp[maxlen];
int main(){
// freopen("in.txt", "r", stdin);
int n, m;
scanf("%d%d", &n, &m);
for(int i=; i<n; i++){
scanf("%s", tmp);
tree.insert(tmp);
}
for(int i=; i<=m; i++){
scanf("%s", tmp+);
printf("%d\n", tree.find(tmp, i));
}
return ;
}

Trie代码学习的更多相关文章

  1. u-boot代码学习内容

    前言  u-boot代码庞大,不可能全部细读,只能有选择的读部分代码.在读代码之前,根据韦东山教材,关于代码学习内容和深度做以下预先划定. 一.Makefile.mkconfig.config.mk等 ...

  2. Objective-C代码学习大纲(3)

    Objective-C代码学习大纲(3) 2011-05-11 14:06 佚名 otierney 字号:T | T 本文为台湾出版的<Objective-C学习大纲>的翻译文档,系统介绍 ...

  3. ORB-SLAM2 论文&代码学习 ——Tracking 线程

    本文要点: ORB-SLAM2 Tracking 线程 论文内容介绍 ORB-SLAM2 Tracking 线程 代码结构介绍 写在前面 上一篇文章中我们已经对 ORB-SLAM2 系统有了一个概览性 ...

  4. ORB-SLAM2 论文&代码学习 —— 单目初始化

    转载请注明出处,谢谢 原创作者:Mingrui 原创链接:https://www.cnblogs.com/MingruiYu/p/12358458.html 本文要点: ORB-SLAM2 单目初始化 ...

  5. ORB-SLAM2 论文&代码学习 —— LocalMapping 线程

    转载请注明出处,谢谢 原创作者:Mingrui 原创链接:https://www.cnblogs.com/MingruiYu/p/12360913.html 本文要点: ORB-SLAM2 Local ...

  6. Learning Memory-guided Normality代码学习笔记

    Learning Memory-guided Normality代码学习笔记 记忆模块核心 Memory部分的核心在于以下定义Memory类的部分. class Memory(nn.Module): ...

  7. 3.1.5 LTP(Linux Test Project)学习(五)-LTP代码学习

    3.1.5 LTP(Linux Test Project)学习(五)-LTP代码学习 Hello小崔 ​ 华为技术有限公司 Linux内核开发 2 人赞同了该文章 LTP代码学习方法主要介绍两个步骤, ...

  8. Apollo代码学习(七)—MPC与LQR比较

    前言 Apollo中用到了PID.MPC和LQR三种控制器,其中,MPC和LQR控制器在状态方程的形式.状态变量的形式.目标函数的形式等有诸多相似之处,因此结合自己目前了解到的信息,将两者进行一定的比 ...

  9. Dagger2 生成代码学习

    接上一篇文章介绍了Dagger2的初步使用,相信刚接触的人会觉得很奇怪,怎么会有很多自己没有定义的代码出现,为什么Component的创建方式是那样的.为了搞清楚这些东西,我们需要查看一下Dagger ...

随机推荐

  1. Shell脚本快速查看网段内ip占用情况和可用ip

    思想就是整个网段ping一遍,对于ping不通的,解析其失败的字符来判定 #!/bin/bash head_add=${} address=${head_add%.*} echo address=$a ...

  2. CF776D The Door Problem[2-SAT]

    翻译 对于一扇门,如果是关的,那么他必须使用其中一个开关开开来,如果是开的,要么使用两个开关,要么啥都不做.这样,每扇门恰好对应两种状态,要选一个. 考虑用2-SAT模型解决.连边的话是对于一个机关, ...

  3. Python3下UnicodeDecodeError:‘ASCII’ codec cant decode..(128)

    今天准备用Keras跑一下LeNet的程序,结果总是编码出错 源代码是2.7写的,编码格式是utf-8.然后尝试网上各种方法不适用,最后还是解决了 源代码: data = gzip.open(r'C: ...

  4. np中的随机函数

      numpy.random.uniform介绍: 1. 函数原型:  numpy.random.uniform(low,high,size)  ==>也即其他函数是对该函数的进一步封装 功能: ...

  5. ACM-ICPC 2015 沈阳赛区现场赛 F. Frogs && HDU 5514(容斥)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5514 题意:有m个石子围成一圈, 有n只青蛙从跳石子, 都从0号石子开始, 每只能越过xi个石子.问所 ...

  6. springboot2.0入门(四)----mock模拟测试+单元测试

    一.本节主要记录模拟测试.单元测试: 二.mock 测试 1.1什么是Mock? 在面向对象程序设计中,模拟对象(英语:mock object,也译作模仿对象)是以可控的方式模拟真实对象行为的假的对象 ...

  7. ansible API 常用模块

    常用模块 用于读取yaml,json格式的文件 from ansible.parsing.dataloader import DataLoader #用于管理变量的类,包括主机,组,扩展等变量 fro ...

  8. python下vs的使用

    part 1:导入pygame包 在python环境下:视图---其他窗口--python环境,选择从pypi安装pygame

  9. DP(第一版)

    序 任何一种具有递推或者递归形式的计算过程,都叫做动态规划 如果你一开始学的时候就不会DP,那么你在考试的时候就一定不会想到用动态规划! 需要进行掌握的内容 1)DP中的基本概念 2)状态 3)转移方 ...

  10. jQuery系列(三):jQuery动画效果

    jQuery提供的一组网页中常见的动画效果,这些动画是标准的.有规律的效果:同时还提供给我们了自定义动画的功能. 1.显示动画 方式一: $("div").show(); 解释:无 ...