Tire树总结(模板+例题)
题目来自《算法竞赛设计指南》
Tire树是一种可以快速查找字符串的数据结构
模板
#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 1123;
int tire[MAXN][26], tot = 1;
bool end[MAXN];
void add(char* str)
{
int len = strlen(str), p = 1;
REP(i, 0, len)
{
int ch = str[i] - 'a'; //这里是a不是0
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
end[p] = true;
}
bool search(char* str)
{
int len = strlen(str), p = 1;
REP(i, 0, len)
if(!(p = tire[p][str[i] - 'a']))
return false;
return end[p];
}
int main()
{
int n, m;
scanf("%d%d", &n, &m);
REP(i, 0, n)
{
char s[15];
scanf("%s", s);
add(s);
}
while(m--)
{
char s[15];
scanf("%s", s);
printf("%s\n", search(s) ? "Yes": "No");
}
return 0;
}
例题.前缀统计
问题: 给n个字符串和m次询问,每次询问给定一个串T,输出有多少个字符串是T的前缀
解答:加入每个字符串的时候在结尾节点加1, 给T后在Tire树上搜一遍,加上沿途字符串结尾的值即可。注意可能有重复的字符串。
#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 1123;
int tire[MAXN][26], tot = 1;
int end[MAXN]; //避免重复字符串
void add(char* str)
{
int p = 1;
REP(i, 0, strlen(str))
{
int ch = str[i] - 'a';
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
end[p]++;
}
int search(char* str)
{
int p = 1, res = 0;
REP(i, 0, strlen(str))
{
if(!(p = tire[p][str[i] - 'a'])) break;
res += end[p];
}
return res;
}
int main()
{
int n, m;
scanf("%d%d", &n, &m);
REP(i, 0, n)
{
char s[15];
scanf("%s", s);
add(s);
}
while(m--)
{
char s[15];
scanf("%s", s);
printf("%d\n", search(s));
}
return 0;
}
hdu 1251
和上一题类似,只不过反过来而已
问题: 给n个字符串和m次询问,每次询问给定一个串T,输出T是多少字符串的前缀
解答:可以dfs一遍处理出来每个节点的子树中(包括节点本身)下有多少个字符终点
然后搜到T的最后一个字符,输出预处理的结果即可
注意这道题的输入比较麻烦,判断*s是否为空
#include<cstdio>
#include<algorithm>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 1e6;
int tire[MAXN][26], d[MAXN], tot = 1;
bool End[MAXN];
void add(char* str)
{
int p = 1;
REP(i, 0, strlen(str))
{
int ch = str[i] - 'a';
if(!tire[p][ch]) tire[p][ch] = ++tot;
p = tire[p][ch];
}
End[p] = true;
}
int dfs(int p)
{
if(End[p]) d[p]++;
REP(ch, 0, 26)
{
if(tire[p][ch])
d[p] += dfs(tire[p][ch]);
}
return d[p];
}
int search(char* str)
{
int p = 1, res = 0;
REP(i, 0, strlen(str))
if(!(p = tire[p][str[i] - 'a'])) return 0;
return d[p];
}
int main()
{
char s[15];
while(gets(s) && *s) add(s);
dfs(1);
while(~scanf("%s", s)) printf("%d\n", search(s));
return 0;
}
【例题】 The XOR Largest Pair
问题:给n个整数A1, A2……An,选出两个数进行异或,得到的结果最大是多少?N <= 1e5, 0 <= Ai < 2^31
解答:我一开始的是把每个数字用二进制的形式表示,然后可以建一颗字典树。然后公共部分肯定异或的值为1.
然后就找最深的结点的数作为第一个数……然后发现找另外一个数就很麻烦了。
看了题解发现要倒着存,也就是从第31位,到第30位……然后每次加入一个数遍历字典树,每次尽量找与当前位不同的数字,这样可以保证最终的结果最大。顺着存就很麻烦。
最后把每个数算出的结果取max即可
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cctype>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 4e6;
int tire[MAXN][2], tot = 1;
void read(int& x)
{
int f = 1; x = 0; char ch = getchar();
while(!isdigit(ch)) { if(ch == '-') f = -1; ch = getchar(); }
while(isdigit(ch)) { x = x * 10 + ch - '0'; ch = getchar(); }
x *= f;
}
void add(int x)
{
int p = 1;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(!tire[p][now]) tire[p][now] = ++tot;
p = tire[p][now];
}
}
int search(int x)
{
int p = 1, res = 0;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(tire[p][now ^ 1])
{
p = tire[p][now ^ 1];
res |= (1 << i);
}
else p = tire[p][now]; //
}
return res;
}
int main()
{
int n; read(n);
int ans = 0;
REP(i, 0, n)
{
int x; read(x);
add(x);
ans = max(ans, search(x));
}
printf("%d\n", ans);
return 0;
}
poj 3764
一开始感觉求路径很麻烦,就不知道怎么做
看了题解发现,原来可以用lca的思想来做,lca之前的部分异或起来都是0.所以x到根的值 ^ y到根的值 = x到y的值
那么我们可以预处理每个节点到根的值,那么就转化成上一道题了。
然后这道题丧心病狂的卡常!!我用vector存边,然后就被卡了……第一次用vector被卡……
所以我还是无奈去学了邻接表,过了,0.5S。然后闲着无聊看看读优的效果,去掉读优后直接飙到0.94S
读优大发好!
然后注意一些细节就好了。
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cctype>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 1e5 + 10;
const int MAXM = 4e6;
int tire[MAXM][2], n, tot, num;
int d[MAXN], head[MAXN];
struct edge { int to, w, next; };
edge e[MAXN << 1]; //双向边乘以2
void addedge(int from, int to, int w)
{
e[tot] = edge{to, w, head[from]};
head[from] = tot++;
}
void read(int& x)
{
int f = 1; x = 0; char ch = getchar();
while(!isdigit(ch)) { if(ch == '-') f = -1; ch = getchar(); }
while(isdigit(ch)) { x = x * 10 + ch - '0'; ch = getchar(); }
x *= f;
}
void dfs(int u, int fa)
{
for(int i = head[u]; ~i; i = e[i].next)
{
int v = e[i].to, w = e[i].w;
if(v == fa) continue;
d[v] = d[u] ^ w;
dfs(v, u);
}
}
void add(int x)
{
int p = 1;
for(int i = 30; i >= 0; i--)
{
int now = (x >> i) & 1;
if(!tire[p][now]) tire[p][now] = ++num;
p = tire[p][now];
}
}
int search(int x)
{
int p = 1, res = 0;
for(int i = 30; i >= 0; i--) //0到2^31-1即从第30位到第0位
{
int now = (x >> i) & 1;
if(tire[p][now ^ 1])
{
p = tire[p][now ^ 1];
res |= (1 << i);
}
else p = tire[p][now];
}
return res;
}
int main()
{
while(~scanf("%d", &n))
{
memset(tire, 0, sizeof(tire));
memset(head, -1, sizeof(head));
num = 1; tot = 0; //注意这里要清零,不只是是数组要清
REP(i, 1, n)
{
int u, v, w;
read(u); read(v); read(w);
addedge(u, v, w);
addedge(v, u, w);
}
dfs(0, -1);
int ans = 0;
REP(i, 0, n)
{
ans = max(ans, search(d[i]));
add(d[i]);
}
printf("%d\n", ans);
}
return 0;
}
poj 3630
以这个很裸的一道题作为结尾
输入一堆字符串,判断有没有字符串是另外一个的前缀。
有两种情况是
(1)加入的时候没有创造新的节点,那么这个字符串就是其他字符串的前缀
(2)如果加入的时候遇到了字符终点,那么就有字符串是当前串的前缀
#include<cstdio>
#include<cctype>
#include<cstring>
#define REP(i, a, b) for(register int i = (a); i < (b); i++)
#define _for(i, a, b) for(register int i = (a); i <= (b); i++)
using namespace std;
const int MAXN = 1e4 + 10;
int tire[MAXN * 10][15], end[MAXN * 10], tot = 1;
bool add(char* s)
{
int p = 1;
bool ok = false;
REP(i, 0, strlen(s))
{
if(end[p]) return false;
int ch = s[i] - '0';
if(!tire[p][ch]) tire[p][ch] = ++tot, ok = true;
p = tire[p][ch];
}
end[p] = 1;
return ok;
}
int main()
{
int T, n;
scanf("%d", &T);
while(T--)
{
scanf("%d", &n);
bool ans = true;
tot = 1;
memset(tire, 0, sizeof(tire));
memset(end, 0, sizeof(end));
REP(i, 0, n)
{
char s[15];
scanf("%s", s);
if(!add(s)) ans = false;
}
printf("%s\n", ans ? "YES" : "NO");
}
return 0;
}
Tire树总结(模板+例题)的更多相关文章
- 【数据结构与算法】Trie(前缀树)模板和例题
Trie 树的模板 Trie 树的简介 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树.他的核心思想是空间换 ...
- Tire树模板-于是他错误的点名开始了
题目背景 XS中学化学竞赛组教练是一个酷爱炉石的人. 他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉(详情请见已结束比赛CON900). ...
- KMP+Tire树(模板)
\(\color{Red}{KMP板子}\) #include <bits/stdc++.h> using namespace std; const int maxn=1e6+9; int ...
- Tire树(字典树)
from:https://www.cnblogs.com/justinh/p/7716421.html Trie,又经常叫前缀树,字典树等等.它有很多变种,如后缀树,Radix Tree/Trie,P ...
- Tire树简介
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种. 典型应用:用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计. 它的优点是:利用字符串的公共 ...
- Codeforces 714C. Sonya and Queries Tire树
C. Sonya and Queries time limit per test:1 second memory limit per test: 256 megabytes input:standar ...
- 中文分词系列(二) 基于双数组Tire树的AC自动机
秉着能偷懒就偷懒的精神,关于AC自动机本来不想看的,但是HanLp的源码中用户自定义词典的识别是用的AC自动机实现的.唉-没办法,还是看看吧 AC自动机理论 Aho Corasick自动机,简称AC自 ...
- 中文分词系列(一) 双数组Tire树(DART)详解
1 双数组Tire树简介 双数组Tire树是Tire树的升级版,Tire取自英文Retrieval中的一部分,即检索树,又称作字典树或者键树.下面简单介绍一下Tire树. 1.1 Tire树 Trie ...
- [数据结构]字典树(Tire树)
概述: Trie是个简单但实用的数据结构,是一种树形结构,是一种哈希树的变种,相邻节点间的边代表一个字符,这样树的每条分支代表一则子串,而树的叶节点则代表完整的字符串.和普通树不同的地方是,相同的字符 ...
随机推荐
- vue 如何动态切换组件,使用is进行切换
日常项目中需要动态去切换组件进行页面展示. 例如:登陆用户是“管理员”或者“普通用户”,需要根据登陆的用户角色切换页面展示的内容.则需要使用 :is 属性进行绑定切换 <template> ...
- vscode快捷键(lua开发)
快速定位行:ctrl+g 查找:ctrl+f 格式化代码:ctrl+alt+f 快速查找到当前复制内容的第一次出现的位置ctrl+d 其他常用不一一列举了
- HDU 2439 The Mussels
The Mussels Time Limit: 1000ms Memory Limit: 32768KB This problem will be judged on HDU. Original ID ...
- rabbitMQ学习笔记(五) 消息路由
生产者会生产出很多消息 , 但是不同的消费者可能会有不同的需求,只需要接收指定的消息,其他的消息需要被过滤掉. 这时候就可以对消息进行过滤了. 在消费者端设置好需要接收的消息类型. 如果不使用默认的E ...
- Storm同时接收多个源(spout和bolt)
参考: http://blog.csdn.net/nyistzp/article/details/51483779
- Unity3D - 图形性能优化:优化着色器载入时间
Unity官方文档之"图形性能优化-优化着色器载入时间"的翻译,E文链接. Optimizing Shader Load Time 优化着色器载入时间 Shaders are sm ...
- ELF文件格式定义
ELF(Executable and Linking Format)是一种对象文件的格式,用于定义不同类型的对象文件(Object files)中都放了什么东西.以及都以什么样的格式去放这些东西.它自 ...
- dnscapy使用——本质上是建立ssh的代理(通过dns tunnel)
git clone https://github.com/cr0hn/dnscapy.git easy_install Scapy 服务端: python dnscapy_server.py a.fr ...
- hdoj--1248--寒冰王座(完全背包)
寒冰王座 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submi ...
- Regexp-Utils:身份证号校验
ylbtech-Regexp-Utils:身份证号校验 1.返回顶部 1.方法 var idCardNoUtil = { /*省,直辖市代码表*/ provinceAndCitys: { 11: &q ...