.Net3.5之后出现了HashSet<T>，硬翻译过来就是“哈希集合”，跟“哈希”两字挂钩说明这种集合的内部实现用到了哈希算法，用Reflector工具就可以发现，HashSet<T>和Dictionary<TKey,TValue>使用了相同的存储方式和哈希冲突算法，那么，它跟Dictionary<TKey,TValue>和Hashtable在使用上到底有什么不同？

HashSet<T>对集合运算的操作

HashSet<T>是一个Set集合，虽然List、Collection也叫集合，但Set集合和它们却大有不同。

HashSet<T>提供了和“Set集合运算”相关的方法，如：

IntersectWith (IEnumerable<T> other) （交集）

public void IntersectWithTest()

        {

            HashSet<int> set1 = new HashSet<int>() { 1, 2, 3 };

            HashSet<int> set2 = new HashSet<int>() { 2, 3, 4 };

            set1.IntersectWith(set2);

            foreach (var item in set1)

            {

                Console.WriteLine(item);

            }

            //输出：2,3

        }

UnionWith (IEnumerable<T> other) （并集）

public void UnionWithTest()

        {

            HashSet<int> set1 = new HashSet<int>() { 1, 2, 3 };

            HashSet<int> set2 = new HashSet<int>() { 2, 3, 4 };

            set1.UnionWith(set2);

            foreach (var item in set1)

            {

                Console.WriteLine(item);

            }

            //输出：1,2,3,4

        }

ExceptWith (IEnumerable<T> other) （排除）

public void ExceptWithTest()

        {

            HashSet<int> set1 = new HashSet<int>() { 1, 2, 3 };

            HashSet<int> set2 = new HashSet<int>() { 2, 3, 4 };

            set1.ExceptWith(set2);

            foreach (var item in set1)

            {

                Console.WriteLine(item);

            }

            //输出：1

        }

这些对集合的操作是List<T>、Hashtable和Dictionary<TKey,TValue>所缺少的，但是伴随着Linq和扩展方法的出现，.net 3.5为泛型集合提供了一系列的扩展方法，使得所有的泛型集合具备了set集合操作的能力。

例如与HashSet的IntersectWith 方法对应的扩展方法是IEnumerable<T> 的Intersect，两者的区别是：

HashSet<T>.IntersectWith 是对当前集合进行修改，没有返回值；

IEnumerable<T>.Intersect并不修改原集合，而是返回了一个新的集合。

实例代码如下：

public void IntersectTest()

        {

            HashSet<int> set1 = new HashSet<int>() { 1, 2, 3 };

            HashSet<int> set2 = new HashSet<int>() { 2, 3, 4 };

            IEnumerable<int> set3=set1.Intersect(set2);

            foreach (var item in set1)

            {

                Console.WriteLine(item);

            }

            foreach (var item in set3)

            {

                Console.WriteLine(item);

            }

            //输出：o

            //set1 : 1,2,3

            //set3 : 2,3

        }

IEnumerable<T> 其他的扩展方法也是一样，都是不改变调用方法的数组，而是产生并返回新的IEnumerable<T>接口类型的数组，当然你可以通过ToArray,ToList,ToDictionary将返回值转换成你想要的集合类型。

至于如何使用这两种集合操作方式，要取决于你的习惯和业务需求。

HashSet<T>的特点

在3.5之前，想用哈希表来提高集合的查询效率，只有Hashtable和Dictionary<TKey,TValue>两种选择，而这两种都是键-值方式的存储。但有些时候，我们只需要其中一个值，例如一个Email集合，如果用泛型哈希表来存储，往往要在Key和Value各保存一次，不可避免的要造成内存浪费。而HashSet<T>只保存一个值，更加适合处理这种情况。

此外，HashSet<T>的Add方法返回bool值，在添加数据时，如果发现集合中已经存在，则忽略这次操作，并返回false值。而Hashtable和Dictionary<TKey,TValue>碰到重复添加的情况会直接抛出错误。

从使用上来看，HashSet<T>和线性集合List<T>更相似一些，但前者的查询效率有着极大的优势。假如，用户注册时输入邮箱要检查唯一性，而当前已注册的邮箱数量达到10万条，如果使用List<T>进行查询，需要遍历一次列表，时间复杂度为O（n），而使用HashSet<T>则不需要遍历，通过哈希算法直接得到列表中是否已存在，时间复杂度为O（1），这是哈希表的查询优势，在上一篇中已提到。

HashSet<T>的不能做的事情

HashSet<T>是Set集合，它只实现了ICollection接口，在单独元素访问上，有很大的限制：

跟List<T>相比，不能使用下标来访问元素，如：list[1] 。

跟Dictionary<TKey,TValue>相比，不能通过键值来访问元素，例如：dic[key]，因为HashSet<T>每条数据只保存一项，并不采用Key-Value的方式，换句话说，HashSet<T>中的Key就是Value，假如已经知道了Key，也没必要再查询去获取Value，需要做的只是检查值是否已存在。

所以剩下的仅仅是开头提到的集合操作，这是它的缺点，也是特点。

总结

综上可知，HashSet<T>是一个Set集合，查询上有较大优势，但无法通过下标方式来访问单个元素，这点会让用惯了List<T>的人（我就是），用起来很不顺手。

HashSet<T>有别于其他哈希表，具有很多集合操作的方法，但优势并不明显，因为.net 3.5之后扩展方法赋予了泛型集合进行集合操作的能力，但扩展方法的集合操作往往返回新的集合，在使用习惯上，我个人更偏爱HashSet<T>的操作方式。

哈希表--HashSet<T>的更多相关文章

HashMap/HashSet,hashCode,哈希表
hash code.equals和“==”三者的关系 1) 对象相等则hashCode一定相等: 2) hashCode相等对象未必相等. == 是比较地址是否相等,JAVA中声明变量都是引用嘛,不同 ...
Junit 注解类加载器 .动态代理 jdbc 连接池 DButils 事务 Arraylist Linklist hashset 异常哈希表的数据结构,存储过程 Map Object String Stringbufere File类文件过滤器_原理分析 flush方法和close方法序列号冲突问题
Junit 注解 3).其它注意事项: 1).@Test运行的方法,不能有形参: 2).@Test运行的方法,不能有返回值: 3).@Test运行的方法,不能是静态方法: 4).在一个类中,可以同时定 ...
stl vector、红黑树、set、multiset、map、multimap、迭代器失效、哈希表(hash_table)、hashset、hashmap、unordered_map、list
stl:即标准模板库,该库包含了诸多在计算机科学领域里所常用的基本数据结构和基本算法六大组件: 容器.迭代器.算法.仿函数.空间配置器.迭代适配器迭代器:迭代器(iterator)是一种抽象的设计 ...
Java学习：Set接口与HashSet集合存储数据的结构（哈希表）
Set接口 java.util.Set接口 extends Collection接口 Set接口的特点: 不允许存储重复的元素没有索引,没有带索引的方法,也不能使用普通的for循环遍历 java.u ...
HashSet集合存储数据的结构(哈希表)和Set集合存储㢝不重复的原理
HashSet集合存储数据的结构(哈希表) Set集合存储㢝不重复的原理前提:存储的元素必须重写hashCode方法和equals方法
Java学习笔记31（集合框架五：set接口、哈希表的介绍）
set接口的特点: 1.不包含重复元素 2.set集合没有索引,只能用迭代器或增强for循环遍历 3.set的底层是map集合方法和Collection的方法基本一样 set接口的实现类HashSe ...
Java List集合和哈希表
List集合和Set集合,先来看List集合. List集合存储元素的特点: 1.有序(List集合中的元素有下标):存进去是什么样,取出来还是什么样 2.可重复可以结合以下的简单代码来看一看. i ...
《数据结构与算法分析：C语言描述》复习——第七章“哈希”——哈希表
2014.06.22 12:36 简介: 哈希是一种数学思想,将不定长数据通过函数转换为定长数据.不定长数据通常意味着碎片化,动态分配内存等等影响存储和性能的因素.当这个定长数据是一个无符号整数时,可 ...
算法与数据结构基础 - 哈希表(Hash Table)
Hash Table基础哈希表(Hash Table)是常用的数据结构,其运用哈希函数(hash function)实现映射,内部使用开放定址.拉链法等方式解决哈希冲突,使得读写时间复杂度平均为O( ...

随机推荐

Hadoop集群（第1期）_CentOS安装配置
CentOS 是什么? CentOS是一个基于Red Hat 企业级 Linux 提供的可自由使用的源代码企业级的 Linux 发行版本.每个版本的 CentOS 都会获得七年的支持(通过安全更新方式 ...
Linux下更好用的帮助命令—cheat
导读 Linux系统中,我们经常会用man命令来帮助查看这个命令的具体用法,man是很强大的,但是英语不好的同学用man用起来可能不那么顺手,自然而然的就出现了cheat命令,cheat命令就是通过简 ...
UItableView 编辑
- (NSString *)tableView:(UITableView *)tableView titleForDeleteConfirmationButtonForRowAtIndexPath:( ...
对原型prototype的详解
刚开始接触对象原型时大脑就开始起义了,脑子就转不灵清了.就感觉怎么着这个概念就是灌输不进去,俗称断路.后面找了很多资料,最主要的还是要借助于<JavaScript语言精髓>这本书,让我对这 ...
CheckBoxList1复选框
循环绑定数据的两个方法: List<string> LIColl = new List<string>(); protected void Page_Load(object s ...
android.content.ActivityNotFoundException: Unable to find explicit activity class have you declared this activity in your AndroidManifest.xml?
在整合PullToRefresh的时候出现如下异常 10-22 23:20:01.826 32331-32331/com.example.news.andoridnewsapp E/AndroidRu ...
Java for LeetCode 047 Permutations II
Given a collection of numbers that might contain duplicates, return all possible unique permutations ...
Android实现电子邮箱客户端
本文主要讲述了安卓平台上利用QQ邮箱SMTP协议,POP3协议发送与接收消息的实现发送邮件核心代码 import java.security.Security; import java.util.D ...
Android之Intent深入
Android中的意图包含多种用法,本文主要包括以下内容显式意图隐匿意图要求结果回传的意图显式意图 :必须指定要激活的组件的完整包名和类名 (应用程序之间耦合在一起) 一般激活自己应用的组件的 ...
mysql 建表语句
修改id为自动增长: alter table book b_ISBN int(11) auto_increment; 自动增长要加的:auto_increment 基本的sql语句: 选择:sel ...

哈希表--HashSet<T>

HashSet<T>对集合运算的操作

HashSet<T>的特点

HashSet<T>的不能做的事情

总结

哈希表--HashSet<T>的更多相关文章

随机推荐

热门专题