NYOJ 163 Phone List （字符串处理字典树）

描述

Given a list of phone numbers, determine if it is consistent in the sense that no number is the prefix of another. Let's say the phone catalogue listed these numbers:

Emergency 911

Alice 97 625 999

Bob 91 12 54 26

In this case, it's not possible to call Bob, because the central would direct your call to the emergency line as soon as you had dialled the first three digits of Bob's phone number. So this list would not be consistent.

输入

The first line of input gives a single integer, 1 ≤ t ≤ 10, the number of test cases. Each test case starts with n, the number of phone numbers, on a separate line, 1 ≤ n ≤ 100000. Then follows n lines with one unique phone number on each line. A phone number is a sequence of at most ten digits.

输出

For each test case, output "YES" if the list is consistent, or "NO" otherwise.

样例输入

911

97625999

91125426

113

12340

123440

12345

98346

样例输出

YES

分析：

其实题目的意思是很简单的，就是在给出的n个电话号码中，找出是否有那个电话号码（必须是这个整体的电话号码，而不是它的一部分）是另一个电话号码的前缀。

这道题是一道典型的字典树的应用，下面补充一下字典树的知识。

Trie树

Trie树，即字典树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。

它有3个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符。
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
每个节点的所有子节点包含的字符都不相同。
字典树的构建

题目：给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，求第一次出现在第几个位置。

分析：这题当然可以用hash来解决，但是本文重点介绍的是trie树，因为在某些方面它的用途更大。比如说对于某一个单词，我们要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。

假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的，一次次缩小范围和提高针对性，这样一个树的模型就渐渐清晰了。

好比假设有b，abc，abd，bcd，abcd，efg，hii 这6个单词，我们构建的树就是如下图这样的：

ok，如上图所示，对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。

那么，对于一个单词，我只要顺着他从根走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。

这样一来我们查询和插入可以一起完成（重点体会这个查询和插入是如何一起完成的，稍后，下文具体解释），所用时间仅仅为单词长度，在这一个样例，便是10。

我们可以看到，trie树每一层的节点数是26^i级别的。所以为了节省空间。我们用动态链表，或者用数组来模拟动态。空间的花费，不会超过单词数×单词长度。

已知n个由小写字母构成的平均长度为10的单词,判断其中是否存在某个串为另一个串的前缀子串。下面对比3种方法：

1.最容易想到的：即从字符串集中从头往后搜，看每个字符串是否为字符串集中某个字符串的前缀，复杂度为O(n^2)。

2.使用hash：我们用hash存下所有字符串的所有的前缀子串，建立存有子串hash的复杂度为O(nlen)，而查询的复杂度为O(n) O(1)= O(n)。

3.使用trie：因为当查询如字符串abc是否为某个字符串的前缀时，显然以b,c,d....等不是以a开头的字符串就不用查找了。所以建立trie的复杂度为O(nlen)，而建立+查询在trie中是可以同时执行的，建立的过程也就可以成为查询的过程，hash就不能实现这个功能。所以总的复杂度为O(nlen)，实际查询的复杂度也只是O(len)。（说白了，就是Trie树的平均高度h为len，所以Trie树的查询复杂度为O（h）=O（len）。好比一棵二叉平衡树的高度为logN，则其查询，插入的平均时间复杂度亦为O（logN））。

查询

Trie树是简单但实用的数据结构，通常用于实现字典查询。我们做即时响应用户输入的AJAX搜索框时，就是Trie开始。本质上，Trie是一颗存储多个字符串的树。相邻节点间的边代表一个字符，这样树的每条分支代表一则子串，而树的叶节点则代表完整的字符串。和普通树不同的地方是，相同的字符串前缀共享同一条分支。下面，再举一个例子。给出一组单词，inn, int, at, age, adv, ant, 我们可以得到下面的Trie：

可以看出：

每条边对应一个字母。
每个节点对应一项前缀。叶节点对应最长前缀，即单词本身。
单词inn与单词int有共同的前缀“in”, 因此他们共享左边的一条分支，root->i->in。同理，ate, age, adv, 和ant共享前缀"a"，所以他们共享从根节点到节点"a"的边。

查询操纵非常简单。比如要查找int，顺着路径i -> in -> int就找到了。

搭建Trie的基本算法也很简单，无非是逐一把每则单词的每个字母插入Trie。插入前先看前缀是否存在。如果存在，就共享，否则创建对应的节点和边。比如要插入单词add，就有下面几步：

考察前缀"a"，发现边a已经存在。于是顺着边a走到节点a。
考察剩下的字符串"dd"的前缀"d"，发现从节点a出发，已经有边d存在。于是顺着边d走到节点ad
考察最后一个字符"d"，这下从节点ad出发没有边d了，于是创建节点ad的子节点add，并把边ad->add标记为d。

代码：

#include<cstdio>
#include<cstring>
#include<iostream>
using namespace std;
struct Node
{
    Node *next[10];///因为电话号码只涉及0~9这是个数字，数组开10就够了
    int end;
    Node()
    {
        memset(next,NULL,sizeof(next));
        end=0;
    }
};
Node *root;
int Insert(char *ch)
{
    Node *now=root;
    int op,flag=0;
    for(int i=0; ch[i]!='\0'; i++)
    {
        op=ch[i]-'0';
        if(now->next[op]==NULL)///当前这个根下没有这个子节点
        {
            now->next[op]=new Node();///构建这个子节点
            flag=1;///标记添加过节点
        }
        now=now->next[op];///指向子节点
        if(now->end==1)///如果已经指向最后了，也就意味着有一个号码是当前这个号码的前缀
            return 0;
    }
    now->end=1;///当前这个号码输入结束
    if(flag==0) return 0;///没有加入节点，一就意味着当前的这个号码是其余电话号码的前缀
    return 1;///没有前缀
}
void clean(Node *now)///把这个树释放
{
    if(now==NULL) return ;
    for(int i=0; i<10; i++)
        if(now->next[i])
            clean(now->next[i]);
    delete now;
}
int main()
{
    int T,n,flag;
    char ch[15];
    scanf("%d",&T);
    while(T--)
    {
        root=new Node();
        flag=true;
        scanf("%d",&n);
        while(n--)
        {
            scanf(" %s",ch);
            if(flag==1)
                flag=Insert(ch);
        }
        clean(root);
        if(flag) printf("YES\n");
        else
            printf("NO\n");
    }
    return 0;
}

NYOJ 163 Phone List （字符串处理字典树）的更多相关文章

I: Carryon的字符串排序(字典树/map映射）
2297: Carryon的字符串 Time Limit: C/C++ 1 s Java/Python 3 s Memory Limit: 128 MB Accepted ...
2017ACM暑期多校联合训练 - Team 6 1001 HDU 6096 String （字符串处理字典树）
题目链接 Problem Description Bob has a dictionary with N words in it. Now there is a list of words in wh ...
数据结构&字符串：字典树
前缀树里面可以存一堆字符串,也可以说是一堆单词,存完之后我们可以轻松判断一个指定的字符串是否出现过下面我来详细解释一下实现细节 *+; //单词个数*每一个单词的字符数 ; struct Trie ...
模板 - 字符串/数据结构 - 字典树/Trie
使用静态数组的nxt指针的设计,大概比使用map作为nxt指针的设计要快1倍,但空间花费大概也大1倍.在数据量小的情况下,时间和空间效率都不及map<vector,int>.map< ...
wannafly 练习赛11 B 假的字符串（字典树+建边找环）
链接:https://www.nowcoder.com/acm/contest/59/B 时间限制:C/C++ 1秒,其他语言2秒空间限制:C/C++ 32768K,其他语言65536K 64bit ...
Find the Clones（字典树）
链接:http://poj.org/problem?id=2945 Description Doubleville, a small town in Texas, was attacked by th ...
字典树 trie树学习
一字典树字典树,又称单词查找树,Trie树,是一种树形结构,哈希表的一个变种二.性质根节点不包含字符,除根节点以外的每一个节点都只包含一个字符: 从根节点到某一节点,路径上经过的字符串连接起 ...
Hat’s Words（字典树的运用）
个人心得:通过这道题,对于树的运用又加深了一点,字典树有着他独特的特点,那个指针的一直转换着实让我好生想半天, 不得不佩服这些发明算法人的大脑. 这题的解决方法还是从网上找到的,还好算法是自己实现得, ...
URAL 1542. Autocompletion 字典树
给你最多10w个单词和相应的频率接下来最多1w5千次询问每次输入一个字符串让你从前面的单词中依照频率从大到小输出最多10个以该字符串为前缀的单词開始把单词建成了字典树然后每次询问找到全部满足条 ...

随机推荐

PHP面向对象之final关键字
最终类最终类,其实就是一种特殊要求的类:要求该类不允许往下继承下去. 形式: final class 类名{ //类的成员定义...跟一般类的定义一样! } 最终方法最终方法,就是一个不允许下 ...
【Linux笔记】Linux中inittab剖析
Linux完成内核(Kernel)引导后,会由init初始化进程调用/etc/inittab配置文件(ps -aux | less,init进程号为始终为1,是所有系统进程的起点,init进程也有一个 ...
【刷题】BZOJ 1036 [ZJOI2008]树的统计Count
Description 一棵树上有n个节点,编号分别为1到n,每个节点都有一个权值w.我们将以下面的形式来要求你对这棵树完成一些操作: I. CHANGE u t : 把结点u的权值改为t II. ...
codeforces765F Souvenirs
本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000 作者博客:http://www.cnblogs.com/ljh2000-jump/ ...
[POJ1094] Sorting It All Out
link 题目大意给出$m$个不等式关系,问可以从第几个开始确定所有之间的大小关系.若无解请输出是无法确定还是与已知矛盾. 试题分析这题是真的是坑啊,尽然放在$floyd$传到闭包上面,还用二分, ...
Linux基础-配置网络、集群内主机名设定、ssh登入、bash命令、通配符（元字符）
作业一:临时配置网络(ip,网关,dns)+永久配置设置临时网络配置: 配置IP ifcongfig ens33 192.168.16.177/24 (ifconfig 网卡 ip地址 /24 ...
DevExpress Components16.2.6 Source Code 重编译教程
DevExpress 是一个比较有名的界面控件套件,提供了一系列优秀的界面控件.这篇文章将展示如何在拥有源代码的情况下,对 DevExpress 的程序集进行重新编译. 特别提示:重编译后,已安装好的 ...
FindBugs错误修改指南【转】
FindBugs错误修改指南 1. EC_UNRELATED_TYPES Bug: Call to equals() comparing different types Pattern id: EC_ ...
lnmp集成环境Access Denied的问题
在你的php.ini配置文件中,设置cgi.fix_pathinfo=1
6.UiWatcher API 详细介绍
Tip: 1.监听器不是完能的,所以若用例需要设置监听器防止用例被打断,最好把延迟时间调高一点 2.UiDevice是不会触发监听功能的 3.监听器在方法体或者循环体中是程序还是会被打断的 4.监听器 ...

NYOJ 163 Phone List （字符串处理 字典树）

NYOJ 163 Phone List （字符串处理 字典树）的更多相关文章

随机推荐

热门专题

NYOJ 163 Phone List （字符串处理字典树）

NYOJ 163 Phone List （字符串处理字典树）的更多相关文章