(转) C#解惑:HashSet<T>类
HashSet<T>
是一个相对“冷门”的类型,平时在项目中用得不多,但是在特定的业务中可以大用。
先来了解下HashSet<T>
类,主要被设计用来存储集合,做高性能集运算,例如两个集合求交集、并集、差集等。从名称可以看出,它是基于Hash的,可以简单理解为没有Value的Dictionary。
HashSet<T>
不能用索引访问,不能存储重复数据,元素T必须正确实现了Equals
和GetHashCode
。
HashSet<T>
的一些特性如下:
HashSet<T>
中的值不能重复且没有顺序。HashSet<T>
的容量会按需自动添加。
HashSet<T>
的优势和与List<T>
的比较
HashSet<T>
最大的优势是检索的性能,简单的说它的Contains方法的性能在大数据量时比List<T>
好得多。曾经做过一个测试,将800W条int类型放在List<int>
集合中,使用Contains判断是否存在,速度巨慢,而放在HashSet<int>
性能得到大幅提升。
在内部算法实现上,HashSet<T>
的Contains方法复杂度是O(1),List<T>
的Contains方法复杂度是O(n),后者数据量越大速度越慢,而HashSet<T>
不受数据量的影响。
所以在集合的目的是为了检索的情况下,我们应该使用HashSet<T>
代替List<T>
。比如一个存储关键字的集合,运行的时候通过其Contains方法检查输入字符串是否关键字。
在3.5之前,想用哈希表来提高集合的查询效率,只有Hashtable和Dictionary两种选择,而这两种都是键-值方式的存储。但有些时候,我们只需要其中一个值,例如一个Email集合,如果用泛型哈希表来存储,往往要在Key和Value各保存一次,不可避免的要造成内存浪费。而HashSet只保存一个值,更加适合处理这种情况。
此外,HashSet的Add方法返回bool值,在添加数据时,如果发现集合中已经存在,则忽略这次操作,并返回false值。而Hashtable和Dictionary碰到重复添加的情况会直接抛出错误。
从使用上来看,HashSet和线性集合List更相似一些,但前者的查询效率有着极大的优势。假如,用户注册时输入邮箱要检查唯一性,而当前已注册的邮箱数量达到10万条,如果使用List进行查询,需要遍历一次列表,时间复杂度为O(n),而使用HashSet则不需要遍历,通过哈希算法直接得到列表中是否已存在,时间复杂度为O(1),这是哈希表的查询优势。
和List的区别
HashSet是Set集合,它只实现了ICollection接口,在单独元素访问上,有很大的限制:
跟List相比,不能使用下标来访问元素,如:list[1] 。
跟Dictionary相比,不能通过键值来访问元素,例如:dic[key],因为HashSet每条数据只保存一项,并不采用Key-Value的方式,换句话说,HashSet中的Key就是Value,假如已经知道了Key,也没必要再查询去获取Value,需要做的只是检查值是否已存在。
所以剩下的仅仅是开头提到的集合操作,这是它的缺点,也是特点。
集合运算
IntersectWith (IEnumerable other) (交集)
- public void IntersectWithTest()
- {
- HashSet<int> set1 = new HashSet<int>() { 1, 2, 3 };
- HashSet<int> set2 = new HashSet<int>() { 2, 3, 4 };
- set1.IntersectWith(set2);
- foreach (var item in set1)
- {
- Console.WriteLine(item);
- }
- //输出:2,3
- }
UnionWith (IEnumerable other) (并集)
public void UnionWithTest()
{
HashSet set1 = new HashSet() { 1, 2, 3 };
HashSet set2 = new HashSet() { 2, 3, 4 };
- set1.UnionWith(set2);
- foreach (var item in set1)
- {
- Console.WriteLine(item);
- }
- //输出:1,2,3,4
- }
ExceptWith (IEnumerable other) (排除)
public void ExceptWithTest()
{
HashSet set1 = new HashSet() { 1, 2, 3 };
HashSet set2 = new HashSet() { 2, 3, 4 };
- set1.ExceptWith(set2);
- foreach (var item in set1)
- {
- Console.WriteLine(item);
- }
- //输出:1
- }
(转) C#解惑:HashSet<T>类的更多相关文章
- C#解惑:HashSet<T>类
原贴: https://blog.csdn.net/X_X_OO/article/details/52529548 https://www.cnblogs.com/refuge/p/9465466.h ...
- HashSet<T>类 用法
HashSet<T>类主要是设计用来做高性能集运算的,例如对两个集合求交集.并集.差集等.集合中包含一组不重复出现且无特性顺序的元素 改变集的值的方法: HashSet<T>的 ...
- HashSet<T>类
HashSet<T>类主要是设计用来做高性能集运算的,例如对两个集合求交集.并集.差集等.集合中包含一组不重复出现且无特性顺序的元素. HashSet<T>的一些特性如下: 1 ...
- (转)HashSet<T>类
转载于:http://www.importnew.com/6931.html HashSet<T>类主要是设计用来做高性能集运算的,例如对两个集合求交集.并集.差集等.集合中包含一组不重复 ...
- HashSet 实现类
HashSet 实现类 通过 HashCode 判断元素是否存在,若存在则不添加,否则添加以此实现唯一性 常用方法 Modifier and Type Method and Description b ...
- Java解惑五:类之谜
本文是依据JAVA解惑这本书,做的笔记.电子书见:http://download.csdn.net/detail/u010378705/7527721 谜题46 函数重载的问题. JAVA重载解析过程 ...
- Set接口HashSet实现类
java.util.Set接口 extends Collection接口 Set特点: 1.不允许有重复的元素 2.没有索引,没有带索引的方法,也不能使用普通的for遍历 java.util.Hash ...
- 微软在 .NET 3.5 新增了一个 HashSet 类,在 .NET 4 新增了一个 SortedSet 类,本文介绍他们的特性,并比较他们的异同。
微软在 .NET 3.5 新增了一个 HashSet 类,在 .NET 4 新增了一个 SortedSet 类,本文介绍他们的特性,并比较他们的异同. .NET Collection 函数库的 Has ...
- Nullable类型和HashSet<T>集合
今天接触到两个新的类型,查了一下才发现它们已经出现好久了,特作一下标记 Nullable结构 在System命名空间下,在 .NET Framework 2.0 版中是新增的:用它定义的值类型的对象与 ...
随机推荐
- 周记【距gdoi:96天】
倒计时从三位数变成了两位数. 然后这周还是很不知道怎么说,经常写一道题写两天.但是总算把后缀数组写完了,也整理完了. 然后周末都不知道干了什么周末就过去了.无聊看了两道省选题发现都是不会做系列,看了以 ...
- Boosting&Bagging
Boosting&Bagging 集成学习方法不是单独的一个机器学习算法,而是通过构建多个机器学习算法来达到一个强学习器.集成学习可以用来进行分类,回归,特征选取和异常点检测等.随机森林算法就 ...
- CF893F Subtree Minimum Query 解题报告
CF893F Subtree Minimum Query 输入输出格式 输入格式: The first line contains two integers \(n\) and \(r\) ( \(1 ...
- HDOJ.2501 Tiling_easy version
Tiling_easy version Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
- 【Cf edu 30 B. Balanced Substring】
time limit per test 1 second memory limit per test 256 megabytes input standard input output standar ...
- POJ 1050 To the Max 二维最大子段和
To the MaxTime Limit: 1000MS Memory Limit: 10000KTotal Submissions: 52281 Accepted: 27633Description ...
- 测试数据库DG搭建为正式库以后做准备
Data guard 部署 1.系统准备(备库只需建立数据库软件) 两台操作系统 oracle linux 7 Node1 172.16.70.191 Node2 172.16.70.192 Orac ...
- appium===安卓SDK下载很慢的解决办法
方法一:http://www.apkbus.com/forum.php?mod=viewthread&tid=240851 方法二:http://www.androiddevtools.cn/
- Linux core dump file详解
Linux core dump file详解 http://www.cnblogs.com/langqi250/archive/2013/03/05/2944931.html
- 【反演复习计划】【COGS2431】爱蜜莉雅的求助
出题人怎么这么不认真啊==明明官方译名是爱蜜莉雅…… 而且我们爱蜜莉雅碳是有英文名哒!是Emilia.你那个aimiliya我实在是无力吐槽…… 不过抱图跑23333首先这很像约数个数和函数诶!但是唯 ...