【Trie】模板（动态指针，静态数组）

Trie树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。

Trie 的强大之处就在于它的时间复杂度。它的插入和查询时间复杂度都为 O(k) ，其中 k 为 key 的长度，与 Trie 中保存了多少个元素无关。Hash 表号称是 O(1) 的，但在计算 hash 的时候就肯定会是 O(k) ，而且还有碰撞之类的问题；Trie 的缺点是空间消耗很高。

基本性质：
（1）根节点不包含字符，除根节点意外每个节点只包含一个字符。
（2）从根节点到某一个节点，路径上经过的字符连接起来，为该节点对应的字符串。
（3）每个节点的所有子节点包含的字符串不相同。

特性：
1）根节点不包含字符，除根节点外每一个节点都只包含一个字符。
2）从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
3）每个节点的所有子节点包含的字符都不相同。
4）如果字符的种数为n，则每个结点的出度为n，这也是空间换时间的体现，浪费了很多的空间。
5）插入查找的复杂度为O(n)，n为字符串长度。

基本思想（以字母树为例）：
1、插入过程

对于一个单词，从根开始，沿着单词的各个字母所对应的树中的节点分支向下走，直到单词遍历完，将最后的节点做标记，表示该单词已插入Trie树。
2、查询过程
从根开始按照单词的字母顺序向下遍历trie树，一旦发现某个节点标记不存在或者单词遍历完成而最后的节点未做标记，则表示该单词不存在，若最后的节点有标记，表示该单词存在。

复杂度：

　　建立Trie的复杂度为O(n*len)，而建立+查询在trie中是可以同时执行的，建立的过程也就可以成为查询的过程。所以总的复杂度为O(n*len)，实际查询的复杂度只是O(len)。

操作：

在Trie树中主要有3个操作，插入、查找和删除。一般情况下Trie树中很少存在删除单独某个结点的情况，因此只考虑删除整棵树。
1、插入

　　假设存在字符串str，Trie树的根结点为root。i=0，p=root。
　　1)取str[i]，判断p->next[str[i]-97]是否为空，若为空，则建立结点temp，并将p->next[str[i]-97]指向temp，然后p指向temp；
　　若不为空，则p=p->next[str[i]-97]；
　　2)i++，继续取str[i]，循环1)中的操作，直到遇到结束符'\0'，此时将当前结点p中的 exist置为true。

2、查找

　　假设要查找的字符串为str，Trie树的根结点为root，i=0，p=root
　　1)取str[i]，判断判断p->next[str[i]-97]是否为空，若为空，则返回false；若不为空，则p=p->next[str[i]-97]，继续取字符。
　　2)重复1)中的操作直到遇到结束符'\0'，若当前结点p不为空并且 exist 为true，则返回true，否则返回false。

3、删除

　　删除可以以递归的形式进行删除。

模板

（静态数组）

 #include<iostream>

 #include<cstdio>

 #include<cstdlib>

 #include<cstring>

 using namespace std;

 const int MAX_N = ;

 typedef struct TrieNode

 {

     bool is_leaf; //标记到字典树从根到当前结点所构成的字符串是否为一个(颜色)单词

     int id;          //当前字符串的编号

     struct TrieNode* next[];

 }TrieNode;

 TrieNode Node;

 TrieNode Root[MAX_N];

 int node_cnt;

 int idn;

 int Insert(char *word)

 {

     TrieNode *p = &Node;

     while(*word)

     {

         int ch = *word - 'a';

         if(p->next[ch] == NULL)

         {

             Root[node_cnt].is_leaf = false;

             Root[node_cnt].id = ;

             p->next[ch] = &Root[node_cnt++];

         }

         p = p->next[ch];

         word++;

     }

     if(p->is_leaf)

         return p->id;

     p->is_leaf = true;

     p->id = ++idn;

     return p->id;

 }

 bool Search(char *word)

 {

     TrieNode *p = &Node;

     while(*word && p)

     {

         p = p->next[*word-'a'];

         word++;

     }

     return(p != NULL && p->is_leaf);

 }

（动态指针）

 #include <iostream>

 #include <cstring>

 #include <cstdlib>

 #include <cstdio>

 using namespace std;

 const int branchNum = ; //声明常量

 int i;

 struct Trie_node

 {

    bool isStr; //记录此处是否构成一个串。

    Trie_node *next[branchNum];//指向各个子树的指针,下标0-25代表26字符

    Trie_node()

    {

        isStr = false;

        memset(next,NULL,sizeof(next));

    }

 };

 class Trie

 {

 public:

    Trie();

    void insert(const char* word);

    bool search(char* word);

    void deleteTrie(Trie_node *root);

 private:

    Trie_node* root;

 };

 Trie::Trie()

 {

    root = new Trie_node();

 }

 void Trie::insert(const char* word)

 {

    Trie_node *location = root;

    while(*word)

    {

        if(location->next[*word-'a'] == NULL)//不存在则建立

        {

            Trie_node *tmp = new Trie_node();

            location->next[*word-'a'] = tmp;

        }

        location = location->next[*word-'a']; //每插入一步，相当于有一个新串经过，指针要向下移动

        word++;

    }

    location->isStr = true; //到达尾部,标记一个串

 }

 bool Trie::search(char *word)

 {

    Trie_node *location = root;

    while(*word && location)

    {

        location = location->next[*word-'a'];

        word++;

    }

    return(location!=NULL && location->isStr);

 }

 void Trie::deleteTrie(Trie_node *root)

 {

    for(i = ; i < branchNum; i++)

    {

        if(root->next[i] != NULL)

        {

            deleteTrie(root->next[i]);

        }

    }

    delete root;

 }

 int main() //简单测试

 {

    Trie t;

    t.insert("a");

    t.insert("abandon");

    char* c = "abandoned";

    t.insert(c);

    t.insert("abashed");

    if(t.search("abashed"))

        printf("true\n");

 }

静态建树与动态建树的主要区别在于插入和删除操作。

插入操作：前者每次插入一个新节点当不存在相应字符时就利用实现已经创建好的数组存放，后者则动态申请一个节点。

删除操作：前者直接将根节点的next全部置为NULL即可，后者要释放所有动态申请的节点空间。

查询操作基本上一样。

然而动态分配内存和静态分配内存性能上存在显著不同！

静态分配会高效很多，但用了一些全局变量，不熟悉的情况下容易出错。熟悉了就没问题了。

动态分配，对于有多个测试实例，如果不释放动态分配的内存，可能导致MLE！

【Trie】模板（动态指针，静态数组）的更多相关文章

"《算法导论》之‘队列’"：队列的三种实现（静态数组、动态数组及指针）
本文有关栈的介绍部分参考自网站数据结构. 1. 队列 1.1 队列的定义队列(Queue)是只允许在一端进行插入,而在另一端进行删除的运算受限的线性表. (1)允许删除的一端称为队头(Front) ...
"《算法导论》之‘栈’"：栈的三种实现（静态数组、动态数组及指针）
本文有关栈的介绍部分参考自网站数据结构. 1. 栈 1.1 栈的定义栈(Stack)是限制仅在表的一端进行插入和删除运算的线性表. (1)通常称插入.删除的这一端为栈顶(Top),另一端称为栈底( ...
C++中关于[]静态数组和new分配的动态数组的区别分析
这篇文章主要介绍了C++中关于[]静态数组和new分配的动态数组的区别分析,很重要的概念,需要的朋友可以参考下本文以实例分析了C++语言中关于[]静态数组和new分配的动态数组的区别,可以帮助大家加 ...
C/C++静态数组与动态数组的区别
简介以下三行代码有什么区别? int a[10]; int *a = (int*)malloc(sizeof(int)*10); int *a = new int[10]; 第一行代码定义a为包含1 ...
delphi中String 和动态静态数组
默认string类型为ansiString:有编译开关控制 shortString: strShort : shortString; strShort 大小256字节,可根据sizeof()计算出,s ...
DelphiXe 中静态数组TByteArray和动态数组TBytes /array of byte 的区别
在应用中发现静态数组和动态数组是有区别的: procedure TForm1.Button1Click(Sender: TObject);var RsltStream: TMemoryStream; ...
Spring MVC 学习总结（七）——FreeMarker模板引擎与动态页面静态化
模板引擎可以让程序实现界面与数据分离,业务代码与逻辑代码的分离,这就提升了开发效率,良好的设计也使得代码复用变得更加容易.一般的模板引擎都包含一个模板解析器和一套标记语言,好的模板引擎有简洁的语法规则 ...
JS 索引数组、关联数组和静态数组、动态数组
JS 索引数组.关联数组和静态数组.动态数组数组分类: 1.从数组的下标分为索引数组.关联数组 var ary1 = [1,3,5,8]; //按索引去取数组元素,从0开始(当然某些语言实现从1开始 ...
c语言实现动态指针数组Dynamic arrays
c语言实现动态数组.其它c的数据结构实现,hashTable參考点击打开链接 treeStruct參考点击打开链接基本原理:事先准备好一个固定长度的数组. 假设长度不够的时候.realloc一块区域 ...

随机推荐

结构类模式（七）：代理（Proxy）
定义为其他对象提供一种代理以控制对这个对象的访问. 代理模式也叫做委托模式,它是一项基本设计技巧.许多其他的模式,如状态模式.策略模式.访问者模式本质上是在更特殊的场合采用了委托模式,而且在日常的应 ...
ASP.NET MVC- 在Area里使用RedirectToAction跳转出错的解决方法
mvc使用Area分区开发后,存在不同Area之间的跳转,需要为每个区间添加Area规则,如下: 按 Ctrl+C 复制代码 using System.Web.Mvc; namespace web.A ...
android 自定义控件二之仿QQ长按删除
自定义Dialog 1.先上个效果图:
VC++中几种字符标志的解释
VC++中几种字符标志的解释 LPSTR = char * LPCSTR = const char * LPWSTR = wchar_t * LPCWSTR = const wchar_t * LPO ...
关于div的居中的问题
(从已经死了一次又一次终于挂掉的百度空间人工抢救出来的,发表日期2014-01-11) div水平和垂直居中,text-align和vertical-align不起作用,因为标签div没有这两个属性, ...
AIM Tech Round (Div. 2) A. Save Luke 水题
A. Save Luke 题目连接: http://codeforces.com/contest/624/problem/A Description Luke Skywalker got locked ...
课本[Teb]软件设计
中文名:课本英文名:Textbook 简称:Teb 一个专注于分享校内课件的软件. 一个课件的整合平台. 发布平台:web>android>ios; 主要功能:预览课件(暂定),搜索课件 ...
hihocoder #1179 : 永恒游戏暴力
#1179 : 永恒游戏 Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://hihocoder.com/problemset/problem/11 ...
TCP具体解释（2）：三次握手与四次挥手
TCP(Transmission Control Protocol,传输控制协议)是基于连接的协议,也就是说,在正式收发数据前,必须和对方建立可靠的连接,就好像你给别人打电话.必须等线路接通了.对方拿 ...
[Ramda] Filter, Reject and Partition
We'll learn how to get a subset of an array by specifying items to include with filter, or items to ...

【Trie】模板（动态指针，静态数组）

【Trie】模板（动态指针，静态数组）的更多相关文章

随机推荐

热门专题