字典树Trie Tree
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
应用
- 串的快速检索
给出N个单词组成的熟词表,以及一篇全用小写英文书写的文章,请你按最早出现的顺序写出所有不在熟词表中的生词。 - 串的排序
给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出。用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。 - 最长公共前缀
对所有串建立字典树,对于两个串的最长公共前缀的长度即他们所在的结点的公共祖先个数,于是,问题就转化为当时公共祖先问题。
字典树通常用next指针数组指向子结点,构造整棵树;但是在比赛中为了避免使用指针出错可以使用数组模拟指针的存储方式。
结点的结构体:
struct trie{
int next[maxn];//maxn = 字符种类的个数
int v;//记录该字符出现次数
}t[maxm];//maxm = 结点个数
插入的过程就是建树的过程,如果当前当前前缀的子结点中已经出现此时读到的字符,将前缀移动到该子结点,并将这一前缀出现的次数加一;反之,在当前前缀后建立新的对应这一字符的子结点,并将前缀移动到该子结点,赋出现次数的初始值为1。
用根结点(trie[0])的v记录整棵树的结点个数,新增结点即++trie[0].v;
代码:
void insert_trie(char *s)
{
int len = strlen(s);
int now = ;
for(int i=;i<len;i++)
{
int key = s[i] - ''; //key的值由字符串字符类型决定
if(t[now].next[key] != -)
{
now = t[now].next[key];
t[now].v ++;
}
else
{
t[now].next[key] = ++t[].v;
now = t[now].next[key];
t[now].v = ;
memset(t[now].next, -, sizeof(t[now].next));
}
}
}
查找即在当前的书中查找公共前缀,代码:
int find_trie(char *s)
{
int len = strlen(s);
int now = ,ret = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
ret = t[now].v;
}
else
return ;
}
return ret;
}
字典树的初始化,将所有trie[0].v个结点的v全都还原为0,next数组初始化为-1。
代码:
void init()
{
for(int i=;i<=t[].v;i++)
{
if(i) t[i].v = ;
memset(t[i].next, -, sizeof(t[i].next));
}
t[].v = ;
}
题
HDU 1251统计难题/一个裸的模版题/
#include <iostream>
#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <string>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>
#define INF 0x3f3f3f3f
#define EPS 0.00000001
#define lowbit(x) (x&(-x))
using namespace std;
typedef long long ll; const int maxn = ;
typedef struct Trie Trie;
typedef struct Trie* ptr;
struct Trie
{
ptr next[maxn];
int v; //表示一个字典树到此有多少相同前缀的数目
};
ptr root; void init()
{
if(root == NULL)
{
root = (ptr) malloc (sizeof(Trie));
root -> v = ;
for(int j=;j<maxn;j++)
root -> next[j] = NULL;
}
} void Insert(char *s)
{
int len = strlen(s);
ptr now = root;
for(int i=;i<len;i++)
{
int key = s[i] - 'a';
if(now -> next[key] != NULL)
{
now -> next[key] -> v ++;
now = now -> next[key];
}
else
{
ptr tmp = (ptr) malloc (sizeof(Trie));
tmp -> v = ;
for(int j=;j<maxn;j++)
tmp -> next[j] = NULL;
now -> next[key] = tmp;
now = tmp;
}
}
} int findTrie(char *s)
{
int len = strlen(s), ret = ;
ptr now = root;
for(int i=;i<len;i++)
{
int key = s[i] - 'a';
if(now -> next[key] != NULL)
{
now = now -> next[key];
ret = now -> v;
}
else
{
return ;
}
}
return ret;
} int main()
{
init();
char s[];
int flag = ;
while(gets(s) != NULL)
{
if(strlen(s) == )
{
flag = ;
continue;
}
if(!flag) Insert(s);
else cout << findTrie(s) << endl;
}
}
HDU 1671Phone List/要加初始化/
#include <iostream>
#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <string>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>
#define INF 0x3f3f3f3f
#define EPS 0.00000001
#define lowbit(x) (x&(-x))
using namespace std;
typedef long long ll; const int maxn = ;
const int maxm = ;
struct trie{
int next[maxn];
int v;
}t[maxm];
char s[maxm][]; void init()
{
for(int i=;i<=t[].v;i++)
{
if(i) t[i].v = ;
memset(t[i].next, -, sizeof(t[i].next));
}
t[].v = ;
} void ins(char *s)
{
int len = strlen(s);
int now = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
t[now].v ++;
}
else
{
t[now].next[key] = ++t[].v;
now = t[now].next[key];
t[now].v = ;
memset(t[now].next, -, sizeof(t[now].next));
}
}
} int findtrie(char *s)
{
int len = strlen(s);
int now = ,ret = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
ret = t[now].v;
}
else
return ;
}
return ret;
} int main()
{
int T;
scanf("%d",&T);
while(T--)
{
init();
int n;
scanf("%d",&n);
for(int i=;i<n;i++)
{
scanf("%s",s[i]);
ins(s[i]);
}
int flag = ;
for(int i=;i<n;i++)
if(findtrie(s[i]) > )
{
flag = ; break;
}
printf(flag ? "NO\n" : "YES\n");
}
}
字典树Trie Tree的更多相关文章
- 字典树(Trie Tree)
在图示中,键标注在节点中,值标注在节点之下.每一个完整的英文单词对应一个特定的整数.Trie 可以看作是一个确定有限状态自动机,尽管边上的符号一般是隐含在分支的顺序中的.键不需要被显式地保存在节点中. ...
- [POJ] #1002# 487-3279 : 桶排序/字典树(Trie树)/快速排序
一. 题目 487-3279 Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 274040 Accepted: 48891 ...
- 字典树trie学习
字典树trie的思想就是利用节点来记录单词,这样重复的单词可以很快速统计,单词也可以快速的索引.缺点是内存消耗大 http://blog.csdn.net/chenleixing/article/de ...
- 『字典树 trie』
字典树 (trie) 字典树,又名\(trie\)树,是一种用于实现字符串快速检索的树形数据结构.核心思想为利用若干字符串的公共前缀来节约储存空间以及实现快速检索. \(trie\)树可以在\(O(( ...
- 字典树(Trie)详解
详解字典树(Trie) 本篇随笔简单讲解一下信息学奥林匹克竞赛中的较为常用的数据结构--字典树.字典树也叫Trie树.前缀树.顾名思义,它是一种针对字符串进行维护的数据结构.并且,它的用途超级广泛.建 ...
- 字典树(Trie树)实现与应用
一.概述 1.基本概念 字典树,又称为单词查找树,Tire数,是一种树形结构,它是一种哈希树的变种. 2.基本性质 根节点不包含字符,除根节点外的每一个子节点都包含一个字符 从根节点到某一节点.路径上 ...
- [转载]字典树(trie树)、后缀树
(1)字典树(Trie树) Trie是个简单但实用的数据结构,通常用于实现字典查询.我们做即时响应用户输入的AJAX搜索框时,就是Trie开始.本质上,Trie是一颗存储多个字符串的树.相邻节点间的边 ...
- Codevs 4189 字典(字典树Trie)
4189 字典 时间限制: 1 s 空间限制: 256000 KB 题目等级 : 大师 Master 传送门 题目描述 Description 最经,skyzhong得到了一本好厉害的字典,这个字典里 ...
- 字典树trie
字典树经常用于单词搜索,现在网络引擎中也应用了trie树: public class Trie{ private int SIZE = 26; private TrieNode root; Trie( ...
随机推荐
- 使用js控制文本超出部分显示省略号
js代码 // 字数限制30字,超出不显示 fontNumber (date) { const length = date.length if (length > 30) { var str = ...
- mysql新建用户,修改权限
(1)登录:mysql -u root -p (2)查看现有用户(mysql8.0.1) mysql> select host,user,authentication_string from m ...
- 洛谷P1739 表达式括号匹配
题目描述 假设一个表达式有英文字母(小写).运算符(+,-,*,/)和左右小(圆)括号构成,以"@"作为表达式的结束符.请编写一个程序检查表达式中的左右圆括号是否匹配,若匹配,则返 ...
- solrj 操作 solr 集群版
一.添加 @Test public void testAddDocument() throws Exception{ //创建一个集群的连接,应该使用 CloudSolrServer,//zkHost ...
- Struts2校验
struts2校验有两种实现方法: 手工编写代码实现(基本验证) //login.jsp <font color="red"><s:fielderror/> ...
- rpc框架--grpc-java
rpc框架--grpc-java grpc源码:https://github.com/grpc/grpc-java/releases/tag/v1.0.0 gradle下载:https://gradl ...
- [React Router] Create a ProtectedRoute Component in React Router (setState callback to force update)
In this lesson we'll create a protected route just for logged in users. We'll combine a Route with a ...
- [Web Worker] Introduce to Web Worker
What is web worker for? OK, read it docs to get full details idea. Or just a quick intro to web work ...
- Python游戏server开发日记(二)绕过GIL启动多线程Python环境
说道Python和多线程,非常easy想到GIL,GIL意味着仅仅要是用Python做的多线程程序.就无法利用多个CPU. 经过一些失败的尝试后,我也一度觉得GIL是无解的.我们甚至把注意力转向了Ir ...
- Ubuntu12.04 下 GTK3.xx 的安装、编译和測试
用此方法成功在UBUNTU 12.04下安装GTK 3.xxx. 一.安装 1.安装gcc/g++/gdb/make 等基本编程工具 $sudo apt-get install build-essen ...