List集合去重方式及效率对比
List集合相信大家在开发过程中几乎都会用到。有时候难免会遇到集合里的数据是重复的,需要进行去除。然而,去重方式有好几种方式,你用的是哪种方式呢?去重方式效率是否是最高效、最优的呢?今天就给大家讲解一下List集合去重的常见及常用的四种方式。
01
实现思路:使用两个for循环遍历集合所有元素,然后进行判断是否有相同元素,如果有,则去除。这种方式是大部分最先想到的,也是最简单的实现方式。其中,这种方式可以保证List集合原来的顺序不变。
代码实现:
/**
* notes:使用两个for循环实现List去重
* @param list
* @return
*/
public static List repeatListWayOne(List<String> list){
for(int i = 0;i < list.size();i++){
for(int j = i+1;j < list.size();j++){
if(list.get(i).equals(list.get(j))){
list.remove(j);
}
}
}
return list;
}
02
实现思路:我们知道HashSet实现了Set接口,不允许出现重复元素。可以基于这个想法,把List集合所有元素存入HashSet对象,接着把List集合元素全部清空,最后把HashSet对象元素全部添加至List集合中,这样就可以保证不出现重复元素。而HashSet有一个构造函数,在初始化时可以直接添加元素。其中,HashSet不能保证顺序不变,所以此方式不能保证List集合原来的顺序不变。
代码实现:
/**
* notes:使用HashSet实现List去重
* @param list
* @return
*/
public static List repeatListWayTwo(List<String> list){
//初始化HashSet对象,并把list对象元素赋值给HashSet对象
HashSet set = new HashSet(list);
//把List集合所有元素清空
list.clear();
//把HashSet对象添加至List集合
list.addAll(set);
return list;
}
03
实现思路:TreeSet集合也是实现Set接口,是一个有序的,并且无重复元素集合。同理,我们可以根据上面方式二的思想进行去重。其中,去重后的List集合可以保证和原来的顺序一致。
代码实现:
/**
* notes:使用TreeSet实现List去重
* @param list
* @return
*/
public static List repeatListWayThird(List<String> list){
//初始化TreeSet对象,并把list对象元素赋值给TreeSet对象
TreeSet set = new TreeSet(list);
//把List集合所有元素清空
list.clear();
//把TreeSet对象添加至List集合
list.addAll(set);
return list;
}
04
实现思路:利用List集合contains方法循环遍历,先创建新的List集合,接着循环遍历原来的List集合,判断新集合是否包含有旧集合,如果有,则不添加至新集合,否则添加。最后,把旧集合清空,把新集合元素赋值给旧集合。
代码实现:
/**
* notes:利用List集合contains方法循环遍历去重
* @param list
* @return
*/
public static List repeatListWayFourth(List<String> list){
//新建新List集合,用于存放去重后的元素
List<String> newList = new ArrayList<String>();
//循环遍历旧集合元素
for(int i = 0; i < list.size(); i++ ){
//判断新集合是否包含有,如果不包含有,则存入新集合中
boolean isContains = newList.contains(list.get(i));
if(!isContains){
newList.add(list.get(i));
}
}
//把List集合所有元素清空
list.clear();
//把新集合元素添加至List集合
list.addAll(newList);
return list;
}
上面给大家介绍了四种List集合去重方式。那么,哪种方式效率是最好的呢?下面就演示一下进行对比。
为了演示方式,随机生成0-500之间的20000个整数字符串,并存入List集合,并在相应代码打印相关时间进行对比。其中,随机生成List集合代码如下:
/**
* 随机生成0-500之间的20000个整数字符串,并存入List集合
* @return
*/
public static List<String> getRandomList(){
List<String> list = new ArrayList<String>();
//随机生成20000个整数字符串
for(int i = 1; i <= 20000; i++){
//任意取[0,500)之间整数,其中0可以取到,500取不到
int number = new Random().nextInt(500);
String number_str = "geshan"+number;
list.add(number_str);
}
return list;
}
为了保证List集合元素一致,创建四个List集合,分别对应List去重方式。效率对比代码如下:
public static void main(String[] args){
//随机生成0-500之间的1000个整数字符串List集合
List<String> list = getRandomList();
//为了演示四种方式效率,创建四个List集合,保证List集合元素一致
//方式一List集合
List<String> oneList = new ArrayList<>();
oneList.addAll(list);
//方式二List集合
List<String> twoList = new ArrayList<>();
twoList.addAll(list);
//方式三List集合
List<String> thirdList = new ArrayList<>();
thirdList.addAll(list);
//方式四List集合
List<String> fourthList = new ArrayList<>();
fourthList.addAll(list);
System.out.println("方式一:使用两个for循环实现List去重");
System.out.println("原来集合大小:"+oneList.size()+",集合元素>>"+oneList);
Date oneDateBegin = new Date();
repeatListWayOne(oneList);
System.out.println("集合去重大小:"+oneList.size()+",集合元素>>"+oneList);
Date oneDateEnd = new Date();
System.out.println("去重所需时间:"+(oneDateEnd.getTime()-oneDateBegin.getTime())+"毫秒");
System.out.println("方式二:使用HashSet实现List去重");
System.out.println("原来集合大小:"+twoList.size()+",集合元素>>"+twoList);
Date twoDateBegin = new Date();
repeatListWayTwo(twoList);
System.out.println("集合去重大小:"+twoList.size()+",集合元素>>"+twoList);
Date twoDateEnd = new Date();
System.out.println("去重所需时间:"+(twoDateEnd.getTime()-twoDateBegin.getTime())+"毫秒");
System.out.println("方式三:使用TreeSet实现List去重");
System.out.println("原来集合大小:"+thirdList.size()+",集合元素>>"+thirdList);
Date thirdDateBegin = new Date();
repeatListWayThird(thirdList);
System.out.println("集合去重大小:"+thirdList.size()+",集合元素>>"+thirdList);
Date thirdDateEnd = new Date();
System.out.println("去重所需时间:"+(thirdDateEnd.getTime()-thirdDateBegin.getTime())+"毫秒");
System.out.println("方式四:利用List集合contains方法循环遍历去重");
System.out.println("原来集合大小:"+fourthList.size()+",集合元素>>"+fourthList);
Date fourthDateBegin = new Date();
repeatListWayFourth(fourthList);
System.out.println("集合去重大小:"+fourthList.size()+",集合元素>>"+fourthList);
Date fourthDateEnd = new Date();
System.out.println("去重所需时间:"+(fourthDateEnd.getTime()-fourthDateBegin.getTime())+"毫秒");
}
多次运行结果如下:
aaarticlea/gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAADUlEQVQImWNgYGBgAAAABQABh6FO1AAAAABJRU5ErkJggg==" alt="" data-ratio="1" data-src="https://mmbiz.qpic.cn/mmbiz_png/b96CibCt70iabWEnNLIJBhGH7rvZ322E9k8bcnJhr5kXfAibQCFc0jHSF6djgCF4sqUZvJmloylYmPjlH8zesicBBA/640" data-w="96" />
第一次四种方式运行时间如下:223、10、16、30;
第二次四种方式运行时间如下:164、10、17、43;
第三次四种方式运行时间如下:164、9、16、37;
综合代码及运行时间对比,方式二是最好的去重方式,代码最简洁、耗时最短。你平时List集合去重,方式用对了吗?
List集合去重方式及效率对比的更多相关文章
- java List 去重方式及效率对比
01 实现思路:使用两个for循环遍历集合所有元素,然后进行判断是否有相同元素,如果有,则去除.这种方式是大部分最先想到的,也是最简单的实现方式.其中,这种方式可以保证List集合原来的顺序不变. 代 ...
- java List去重方式及效率对比
对List去重并保证添加顺序主要有三种方式: 方式一,利用HashSet不能添加重复数据的特性 由于HashSet不能保证添加顺序,所以只能作为判断条件: private static void re ...
- 浅谈集合框架四——集合扩展:集合循环输出方式及list输出方式的效率对比
最近刚学完集合框架,想把自己的一些学习笔记与想法整理一下,所以本篇博客或许会有一些内容写的不严谨或者不正确,还请大神指出.初学者对于本篇博客只建议作为参考,欢迎留言共同学习. 之前有介绍集合框架的体系 ...
- java中多种写文件方式的效率对比实验
一.实验背景 最近在考虑一个问题:“如果快速地向文件中写入数据”,java提供了多种文件写入的方式,效率上各有异同,基本上可以分为如下三大类:字节流输出.字符流输出.内存文件映射输出.前两种又可以分为 ...
- Java——反射三种方式的效率对比
转载自:https://blog.csdn.net/aitcax/article/details/52694423 1 使用field(效率最高) long start = S ...
- 将List按照指定大小等分的几种实现方式和效率对比及优化
今天碰到一个需求,定时任务,批量从表里取数据并做一些其他操作然后再存表,每次取1000条,由于计算过程比较耗时所以要起多个线程同时跑,需要将List按照指定大小等分,如每100条数据起一个线程,若最后 ...
- python下图像读取方式以及效率对比
https://zhuanlan.zhihu.com/p/30383580 opencv速度最快,值得注意的是mxnet的采用多线程读取的方式,可大大加速
- Redis查询&JDBC查询&Hibernate查询方式的效率比较...
比较三种查询方式查询效率对比...我是用的JavaWeb的方式通过通过JSP页面查询的填写查询的参数...给予反馈.... 整个demo的下载地址:http://files.cnblogs.com/f ...
- SIMD---SSE系列及效率对比
SSE(即Streaming SIMD Extension),是对由MMX指令集引进的SIMD模型的扩展.我们知道MMX有两个明显的缺点: 只能操作整数. 不能与浮点数同时运行(MMX使用FPU寄存器 ...
随机推荐
- Kinect舒适区范围--UE4 的Blueprint测试范例
本文章由cartzhang编写,转载请注明出处. 所有权利保留. 文章链接: http://blog.csdn.net/cartzhang/article/details/44748475 作者:ca ...
- GlobalMemoryStatus 和 GlobalMemoryStatusEx
1.获取系统内存信息有2个api,分别是GlobalMemoryStatus和GlobalMemoryStatusEx.GlobalMemoryStatus函数可以在C语言里直接调用,但是Global ...
- Delphi程序的自我修改
前言: 对于Delphi在编译时对代码所做的工作,大部分使用Object Pascal之类的高级语言的程序员并不是很熟悉.如果你对汇编程序以及EXE文件格式有一点基本认识,那么源代码里包含的注 ...
- 前端切图:调用百度地图API
原型图 图片发自简书App <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> ...
- 【u239】整数分解
Time Limit: 1 second Memory Limit: 128 MB [问题描述] 某些数能表示成为一些互不相同的整数的阶乘之和.如9=l!+2! +3!. 现在给定一个非负整数n,要求 ...
- erlang抽象码与basho的protobuf
erlang抽象码与basho的protobuf(一)使用 erlang抽象码与basho的protobuf(二)代码生成原理之词法与语法分析 erlang抽象码与basho的protobuf(三)代 ...
- UIlabel文字大小自适应label宽度变大变小
label.adjustsFontSizeToFitWidth = YES; //默认no
- 【codeforces 782B】The Meeting Place Cannot Be Changed
[题目链接]:http://codeforces.com/contest/782/problem/B [题意] 每个人都有一个速度,只能往上走或往下走; 然后让你找一个地方,所有人都能够在t时间内到达 ...
- Eclipse Che开发Spring Web应用(入门) (二)
在上篇博客中我们介绍了如何安装Eclipse Che这种浏览器SDK之后,收到了许多开发者的提问,为了方便初学者开发Java web应用,笔者又一步步实践了spring web开发(demo)过程,欢 ...
- matlab 格式化文本文件的解析
比如这样一种格式化的文本文件,文件说明及下载地址:/pub/machine-learning-databases/statlog/german/ 的索引 fid = fopen('german.dat ...