题目来自《算法竞赛设计指南》

Tire树是一种可以快速查找字符串的数据结构

模板

#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 1123;
int tire[MAXN][26], tot = 1;
bool end[MAXN]; void add(char* str)
{
int len = strlen(str), p = 1;
REP(i, 0, len)
{
int ch = str[i] - 'a'; //这里是a不是0
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
end[p] = true;
} bool search(char* str)
{
int len = strlen(str), p = 1;
REP(i, 0, len)
if(!(p = tire[p][str[i] - 'a']))
return false;
return end[p];
} int main()
{
int n, m;
scanf("%d%d", &n, &m);
REP(i, 0, n)
{
char s[15];
scanf("%s", s);
add(s);
}
while(m--)
{
char s[15];
scanf("%s", s);
printf("%s\n", search(s) ? "Yes": "No");
}
return 0;
}

例题.前缀统计

问题: 给n个字符串和m次询问,每次询问给定一个串T,输出有多少个字符串是T的前缀

解答:加入每个字符串的时候在结尾节点加1, 给T后在Tire树上搜一遍,加上沿途字符串结尾的值即可。注意可能有重复的字符串。

#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 1123;
int tire[MAXN][26], tot = 1;
int end[MAXN]; //避免重复字符串 void add(char* str)
{
int p = 1;
REP(i, 0, strlen(str))
{
int ch = str[i] - 'a';
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
end[p]++;
} int search(char* str)
{
int p = 1, res = 0;
REP(i, 0, strlen(str))
{
if(!(p = tire[p][str[i] - 'a'])) break;
res += end[p];
}
return res;
} int main()
{
int n, m;
scanf("%d%d", &n, &m);
REP(i, 0, n)
{
char s[15];
scanf("%s", s);
add(s);
}
while(m--)
{
char s[15];
scanf("%s", s);
printf("%d\n", search(s));
}
return 0;
}

hdu 1251

和上一题类似,只不过反过来而已

问题: 给n个字符串和m次询问,每次询问给定一个串T,输出T是多少字符串的前缀

解答:可以dfs一遍处理出来每个节点的子树中(包括节点本身)下有多少个字符终点

然后搜到T的最后一个字符,输出预处理的结果即可

注意这道题的输入比较麻烦,判断*s是否为空

#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 1e6;
int tire[MAXN][26], d[MAXN], tot = 1;
bool End[MAXN]; void add(char* str)
{
int p = 1;
REP(i, 0, strlen(str))
{
int ch = str[i] - 'a';
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
End[p] = true;
} int dfs(int p)
{
if(End[p]) d[p]++;
REP(ch, 0, 26)
{
if(tire[p][ch])
d[p] += dfs(tire[p][ch]);
}
return d[p];
} int search(char* str)
{
int p = 1, res = 0;
REP(i, 0, strlen(str))
if(!(p = tire[p][str[i] - 'a'])) return 0;
return d[p];
} int main()
{
char s[15];
while(gets(s) && *s) add(s);
dfs(1);
while(~scanf("%s", s)) printf("%d\n", search(s));
return 0;
}

【例题】 The XOR Largest Pair

问题:给n个整数A1, A2……An,选出两个数进行异或,得到的结果最大是多少?N <= 1e5, 0 <= Ai < 2^31

解答:我一开始的是把每个数字用二进制的形式表示,然后可以建一颗字典树。然后公共部分肯定异或的值为1.

然后就找最深的结点的数作为第一个数……然后发现找另外一个数就很麻烦了。

看了题解发现要倒着存,也就是从第31位,到第30位……然后每次加入一个数遍历字典树,每次尽量找与当前位不同的数字,这样可以保证最终的结果最大。顺着存就很麻烦。

最后把每个数算出的结果取max即可

#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cctype>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 4e6;
int tire[MAXN][2], tot = 1; void read(int& x)
{
int f = 1; x = 0; char ch = getchar();
while(!isdigit(ch)) { if(ch == '-') f = -1; ch = getchar(); }
while(isdigit(ch)) { x = x * 10 + ch - '0'; ch = getchar(); }
x *= f;
} void add(int x)
{
int p = 1;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(!tire[p][now]) tire[p][now] = ++tot;
p = tire[p][now];
}
} int search(int x)
{
int p = 1, res = 0;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(tire[p][now ^ 1])
{
p = tire[p][now ^ 1];
res |= (1 << i);
}
else p = tire[p][now]; //
}
return res;
} int main()
{
int n; read(n);
int ans = 0;
REP(i, 0, n)
{
int x; read(x);
add(x);
ans = max(ans, search(x));
}
printf("%d\n", ans);
return 0;
}

poj 3764

一开始感觉求路径很麻烦,就不知道怎么做

看了题解发现,原来可以用lca的思想来做,lca之前的部分异或起来都是0.所以x到根的值 ^ y到根的值 = x到y的值

那么我们可以预处理每个节点到根的值,那么就转化成上一道题了。

然后这道题丧心病狂的卡常!!我用vector存边,然后就被卡了……第一次用vector被卡……

所以我还是无奈去学了邻接表,过了,0.5S。然后闲着无聊看看读优的效果,去掉读优后直接飙到0.94S

读优大发好!

然后注意一些细节就好了。

#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cctype>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 1e5 + 10;
const int MAXM = 4e6;
int tire[MAXM][2], n, tot, num;
int d[MAXN], head[MAXN];
struct edge { int to, w, next; };
edge e[MAXN << 1]; //双向边乘以2 void addedge(int from, int to, int w)
{
e[tot] = edge{to, w, head[from]};
head[from] = tot++;
} void read(int& x)
{
int f = 1; x = 0; char ch = getchar();
while(!isdigit(ch)) { if(ch == '-') f = -1; ch = getchar(); }
while(isdigit(ch)) { x = x * 10 + ch - '0'; ch = getchar(); }
x *= f;
} void dfs(int u, int fa)
{
for(int i = head[u]; ~i; i = e[i].next)
{
int v = e[i].to, w = e[i].w;
if(v == fa) continue;
d[v] = d[u] ^ w;
dfs(v, u);
}
} void add(int x)
{
int p = 1;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(!tire[p][now]) tire[p][now] = ++num;
p = tire[p][now];
}
} int search(int x)
{
int p = 1, res = 0;
for(int i = 30; i >= 0; i--) //0到2^31-1即从第30位到第0位
{
int now = (x >> i) & 1;
if(tire[p][now ^ 1])
{
p = tire[p][now ^ 1];
res |= (1 << i);
}
else p = tire[p][now];
}
return res;
} int main()
{
while(~scanf("%d", &n))
{
memset(tire, 0, sizeof(tire));
memset(head, -1, sizeof(head));
num = 1; tot = 0; //注意这里要清零,不只是是数组要清 REP(i, 1, n)
{
int u, v, w;
read(u); read(v); read(w);
addedge(u, v, w);
addedge(v, u, w);
} dfs(0, -1); int ans = 0;
REP(i, 0, n)
{
ans = max(ans, search(d[i]));
add(d[i]);
}
printf("%d\n", ans);
} return 0;
}

poj 3630

以这个很裸的一道题作为结尾

输入一堆字符串,判断有没有字符串是另外一个的前缀。

有两种情况是

(1)加入的时候没有创造新的节点,那么这个字符串就是其他字符串的前缀

(2)如果加入的时候遇到了字符终点,那么就有字符串是当前串的前缀

#include<cstdio>
#include<cctype>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std; const int MAXN = 1e4 + 10;
int tire[MAXN * 10][15], end[MAXN * 10], tot = 1; bool add(char* s)
{
int p = 1;
bool ok = false;
REP(i, 0, strlen(s))
{
if(end[p]) return false;
int ch = s[i] - '0';
if(!tire[p][ch]) tire[p][ch] = ++tot, ok = true;
p = tire[p][ch];
}
end[p] = 1;
return ok;
} int main()
{
int T, n;
scanf("%d", &T); while(T--)
{
scanf("%d", &n);
bool ans = true;
tot = 1;
memset(tire, 0, sizeof(tire));
memset(end, 0, sizeof(end)); REP(i, 0, n)
{
char s[15];
scanf("%s", s);
if(!add(s)) ans = false;
}
printf("%s\n", ans ? "YES" : "NO");
} return 0;
}

Tire树总结(模板+例题)的更多相关文章

  1. 【数据结构与算法】Trie(前缀树)模板和例题

    Trie 树的模板 Trie 树的简介 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树.他的核心思想是空间换 ...

  2. Tire树模板-于是他错误的点名开始了

    题目背景 XS中学化学竞赛组教练是一个酷爱炉石的人. 他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉(详情请见已结束比赛CON900). ...

  3. KMP+Tire树(模板)

    \(\color{Red}{KMP板子}\) #include <bits/stdc++.h> using namespace std; const int maxn=1e6+9; int ...

  4. Tire树(字典树)

    from:https://www.cnblogs.com/justinh/p/7716421.html Trie,又经常叫前缀树,字典树等等.它有很多变种,如后缀树,Radix Tree/Trie,P ...

  5. Tire树简介

    又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种. 典型应用:用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计. 它的优点是:利用字符串的公共 ...

  6. Codeforces 714C. Sonya and Queries Tire树

    C. Sonya and Queries time limit per test:1 second memory limit per test: 256 megabytes input:standar ...

  7. 中文分词系列(二) 基于双数组Tire树的AC自动机

    秉着能偷懒就偷懒的精神,关于AC自动机本来不想看的,但是HanLp的源码中用户自定义词典的识别是用的AC自动机实现的.唉-没办法,还是看看吧 AC自动机理论 Aho Corasick自动机,简称AC自 ...

  8. 中文分词系列(一) 双数组Tire树(DART)详解

    1 双数组Tire树简介 双数组Tire树是Tire树的升级版,Tire取自英文Retrieval中的一部分,即检索树,又称作字典树或者键树.下面简单介绍一下Tire树. 1.1 Tire树 Trie ...

  9. [数据结构]字典树(Tire树)

    概述: Trie是个简单但实用的数据结构,是一种树形结构,是一种哈希树的变种,相邻节点间的边代表一个字符,这样树的每条分支代表一则子串,而树的叶节点则代表完整的字符串.和普通树不同的地方是,相同的字符 ...

随机推荐

  1. vue 如何动态切换组件,使用is进行切换

    日常项目中需要动态去切换组件进行页面展示. 例如:登陆用户是“管理员”或者“普通用户”,需要根据登陆的用户角色切换页面展示的内容.则需要使用 :is 属性进行绑定切换 <template> ...

  2. vscode快捷键(lua开发)

    快速定位行:ctrl+g 查找:ctrl+f 格式化代码:ctrl+alt+f 快速查找到当前复制内容的第一次出现的位置ctrl+d 其他常用不一一列举了

  3. HDU 2439 The Mussels

    The Mussels Time Limit: 1000ms Memory Limit: 32768KB This problem will be judged on HDU. Original ID ...

  4. rabbitMQ学习笔记(五) 消息路由

    生产者会生产出很多消息 , 但是不同的消费者可能会有不同的需求,只需要接收指定的消息,其他的消息需要被过滤掉. 这时候就可以对消息进行过滤了. 在消费者端设置好需要接收的消息类型. 如果不使用默认的E ...

  5. Storm同时接收多个源(spout和bolt)

    参考: http://blog.csdn.net/nyistzp/article/details/51483779

  6. Unity3D - 图形性能优化:优化着色器载入时间

    Unity官方文档之"图形性能优化-优化着色器载入时间"的翻译,E文链接. Optimizing Shader Load Time 优化着色器载入时间 Shaders are sm ...

  7. ELF文件格式定义

    ELF(Executable and Linking Format)是一种对象文件的格式,用于定义不同类型的对象文件(Object files)中都放了什么东西.以及都以什么样的格式去放这些东西.它自 ...

  8. dnscapy使用——本质上是建立ssh的代理(通过dns tunnel)

    git clone https://github.com/cr0hn/dnscapy.git easy_install Scapy 服务端: python dnscapy_server.py a.fr ...

  9. hdoj--1248--寒冰王座(完全背包)

    寒冰王座 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submi ...

  10. Regexp-Utils:身份证号校验

    ylbtech-Regexp-Utils:身份证号校验 1.返回顶部 1.方法 var idCardNoUtil = { /*省,直辖市代码表*/ provinceAndCitys: { 11: &q ...