java list去重方式,以及效率问题
之前面试被问到关于java如何去重的问题,当时没怎么留意,今天刚好项目中用到了,所以记录一下。
实体类:
/**
* 用户类
*/
class User{
private String username;
private String password; public User(String username, String password) {
this.username = username;
this.password = password;
} public String getUsername() {
return username;
} public void setUsername(String username) {
this.username = username;
} public String getPassword() {
return password;
} public void setPassword(String password) {
this.password = password;
}
}
测试类:
public static void main(String[] args) {
ArrayList<User> arrayList = new ArrayList<>();
long currentTimeMillis = System.currentTimeMillis();
int f = 100000;
for(int i = 0; i < f; i++){
arrayList.add(new User(""+i, "7878"));
}
Iterator<User> iterator = arrayList.iterator();
Set<String> hashSet = new HashSet<>();
LinkedList<User> newList = new LinkedList<>();
// 第一种:set集合去重,不改变原有的顺序,根据username唯一标识去重
while (iterator.hasNext()){
User u = iterator.next();
// 根据set不能存放相同值的特性
if(!StringUtils.isEmpty(u.getUsername())){
if (hashSet.add(u.getUsername())){
// 将其重新放入在LinkedList中
newList.add(u);
}
}
}
long currentTimeMillis1_1 = System.currentTimeMillis();
System.out.println("第一种set集合去重,不改变原有的顺序:"+(currentTimeMillis1_1 - currentTimeMillis));
// 第二种:遍历后判断赋给另一个list集合,利用List的contains方法循环遍历
List<User> listNew=new ArrayList<>();
for (User str:arrayList) {
if(!listNew.contains(str)){
listNew.add(str);
}
}
long currentTimeMillis1_2 = System.currentTimeMillis();
System.out.println("第二种:遍历后判断赋给另一个list集合,利用List的contains方法循环遍历:"+(currentTimeMillis1_2 - currentTimeMillis1_1));
// 第三种:set去重
Set set = new HashSet();
List<String> listNew2=new ArrayList<>();
set.addAll(arrayList);
listNew2.addAll(set);
long currentTimeMillis1_3 = System.currentTimeMillis();
System.out.println(" 第三种:set去重"+(currentTimeMillis1_3 - currentTimeMillis1_2));
// 第四种:set去重(缩减为一行)
List<String> listNew3=new ArrayList<>(new HashSet(arrayList));
long currentTimeMillis1_4 = System.currentTimeMillis();
System.out.println("第四种:set去重(缩减为一行)"+(currentTimeMillis1_4 - currentTimeMillis1_3));
// 第五种:去重并按自然顺序排序
/* TreeSet treeSet = new TreeSet(arrayList);
List tempList = new ArrayList();
tempList.addAll(treeSet);
//List<User> listNew4=new ArrayList<>(new TreeSet<User>(arrayList));
long currentTimeMillis1_5 = System.currentTimeMillis();
System.out.println(currentTimeMillis1_5 - currentTimeMillis1_4);*/
// 第六种:双重for循环,去重
for(int i = 0 ; i < arrayList.size() - 1; i ++){
for(int j = arrayList.size() - 1; j > i; j --){
if(arrayList.get(j).equals(arrayList.get(i))){
arrayList.remove(j);
}
}
}
long currentTimeMillis1_6 = System.currentTimeMillis();
System.out.println("第六种:双重for循环,去重"+(currentTimeMillis1_6 - currentTimeMillis1_4));
// 第七种:利用HashSet不能添加重复数据的特性 由于HashSet不能保证添加顺序,所以只能作为判断条件
HashSet<User> set2 = new HashSet<>(arrayList.size());
List<User> result = new ArrayList<>(arrayList.size());
for (User str3 : arrayList) {
if (set2.add(str3)) {
result.add(str3);
}
}
arrayList.clear();
arrayList.addAll(result);
long currentTimeMillis1_7 = System.currentTimeMillis();
System.out.println("第七种:利用HashSet不能添加重复数据的特性 由于HashSet不能保证添加顺序,所以只能作为判断条件"+(currentTimeMillis1_7 - currentTimeMillis1_6));
// 第八种:利用LinkedHashSet不能添加重复数据并能保证添加顺序的特性
LinkedHashSet<User> set5 = new LinkedHashSet<>(arrayList.size());
set5.addAll(arrayList);
arrayList.clear();
arrayList.addAll(set5);
long currentTimeMillis1_8 = System.currentTimeMillis();
System.out.println("第八种:利用LinkedHashSet不能添加重复数据并能保证添加顺序的特性"+(currentTimeMillis1_8 - currentTimeMillis1_7));
}
控制台输出:

提示:在数据量大的情况下,最好不要使用第二种和第六种,速度太慢了
至于效率问题大家自己根据实际情况选择吧。
java list去重方式,以及效率问题的更多相关文章
- java List 去重方式及效率对比
01 实现思路:使用两个for循环遍历集合所有元素,然后进行判断是否有相同元素,如果有,则去除.这种方式是大部分最先想到的,也是最简单的实现方式.其中,这种方式可以保证List集合原来的顺序不变. 代 ...
- java List去重方式及效率对比
对List去重并保证添加顺序主要有三种方式: 方式一,利用HashSet不能添加重复数据的特性 由于HashSet不能保证添加顺序,所以只能作为判断条件: private static void re ...
- List集合去重方式及效率对比
List集合相信大家在开发过程中几乎都会用到.有时候难免会遇到集合里的数据是重复的,需要进行去除.然而,去重方式有好几种方式,你用的是哪种方式呢?去重方式效率是否是最高效.最优的呢?今天就给大家讲解一 ...
- java map遍历方式及效率
本文转载自Java Map遍历方式的选择. 只给出遍历方式及结论.测试数据可以去原文看. 如果你使用HashMap 同时遍历key和value时,keySet与entrySet方法的性能差异取决于ke ...
- java list 去重
Guava ImmutableSet源码去重处理,Hash处理 - 汪小哥 - CSDN博客 https://blog.csdn.net/u012881904/article/details/6895 ...
- java list去重操作实现方式
Java中的List是可以包含重复元素的(hash code 和equals),接下来将介绍两种方式实现java list去重操作,感兴趣的朋友可以参考下 Java中的List是可以包含重复元素的 ...
- java中多种写文件方式的效率对比实验
一.实验背景 最近在考虑一个问题:“如果快速地向文件中写入数据”,java提供了多种文件写入的方式,效率上各有异同,基本上可以分为如下三大类:字节流输出.字符流输出.内存文件映射输出.前两种又可以分为 ...
- java int转String全部方式的效率对照与深入解析
在java中,大家肯定都会遇到int类型转String类型的情形,知其然知其所以然.总结加分析一下,int类型转String类型有下面几种方式: a+"" String.value ...
- java多种文件复制方式以及效率比较
1.背景 java复制文件的方式其实有很多种,可以分为 传统的字节流读写复制FileInputStream,FileOutputStream,BufferedInputStream,BufferedO ...
随机推荐
- 软考题型—PERT图(项目计划评审技术)
经历过软件危机和大量软件项目的失败,人们对软件工程产业现状进行分析后,得出普遍性结论便是:软件项目成功率低的原因很可能就是项目管理能力太弱.由于软件本身的特殊性和复杂性,将项目管理思想引入软件工程领域 ...
- UDP协议&socketserver模块
UDP协议&socketserver模块 一.UDP协议 1.1 UDP实现简单通信 服务器 ------------------------------------------------- ...
- Maven出错的问题处理
1:使用Maven部署dubbox.jar包到maven本地仓库 由于Dubbox的jar包并没有部署到Maven的中央仓库中,大家在Maven的中央仓库中可以查找到Dubbo的最终版本是2.5.3 ...
- Javaweb实训-宠物医院-社区宠物医院的页面样式
/* CSS Document */ /* 对于CSS来说 每一个元素默认的margin和padding就是0px.但是不同的浏览器会有一个默认的浏览器样式修改默认的marg ...
- 2015 四川省赛 C Censor(哈希 | KMP)
模式串为子串 KMP /* @author : victor */ #include <bits/stdc++.h> using namespace std; typedef long l ...
- vlang
参考 V语言中文教程 - 基础部分
- fullpage实现(-)
在线demo还没弄好,地址先给出来
- linux各路径(目录)的解释
目录 /bin 存放二进制可执行文件(ls,cat,mkdir等),常用命令一般都在这里. /etc 存放系统管理和配置文件 /home 存放所有用户文件的根目录,是用户主目录的基点, 比如用户use ...
- windows 快捷键相关命令
Mstsc 远程链接 Taskmgr 任务管理器 Regedit 打开注册表 Netstat -ano | find “80” 查找内容 tasklist /fi "pid eq 57 ...
- python2 'ascii'编码问题
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 223: ordinal not in range(128) ...