1 简介

在日常开发中,ArrayListHashSet都是Java中很常用的集合类。

  • ArrayListList接口最常用的实现类;
  • HashSet则是保存唯一元素Set的实现。

本文主要对两者共有的方法contains()做一个简单的讨论,主要是性能上的对比,并用JMH(ava Microbenchmark Harness)进行测试比较。

2 先看JMH测试结果

我们使用一个由OpenJDK/Oracle里面开发了Java编译器的大牛们所开发的Micro Benchmark Framework来测试。下面简单展示一下使用过程。

2.1 Maven导入相关依赖

导入JMH的相关依赖,可以去官网查看最新版本:

<dependencies>
<dependency>
<groupId>org.openjdk.jmh</groupId>
<artifactId>jmh-core</artifactId>
<version>${openjdk.jmh.version}</version>
</dependency>
<dependency>
<groupId>org.openjdk.jmh</groupId>
<artifactId>jmh-generator-annprocess</artifactId>
<version>${openjdk.jmh.version}</version>
</dependency>
</dependencies> <properties>
<openjdk.jmh.version>1.19</openjdk.jmh.version>
</properties>

2.2 创建测试相关的类

2.2.1 集合储存对象的类

因为要测试集合类的方法,所以我们创建一个类来表示集合所储存的对象。如下:

@Data
@AllArgsConstructor(staticName = "of")
public class Student {
private Long id;
private String name;
}

2.2.2 JMH测试类

接下来我们就来写测试性能对比的类,代码如下:

@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class ContainsPerformanceTest {
@State(Scope.Thread)
public static class MyState {
private Set<Student> studentSet = new HashSet<>();
private List<Student> studentList = new ArrayList<>();
private Student targetStudent = Student.of(99L, "Larry"); @Setup(Level.Trial)
public void prepare() {
long MAX_COUNT = 10000;
for (long i = 0; i < MAX_COUNT; i++) {
studentSet.add(Student.of(i, "MQ"));
studentList.add(Student.of(i, "MQ"));
}
studentList.add(targetStudent);
studentSet.add(targetStudent);
}
} @Benchmark
public boolean arrayList(MyState state) {
return state.studentList.contains(state.targetStudent);
} @Benchmark
public boolean hashSet(MyState state) {
return state.studentSet.contains(state.targetStudent);
} public static void main(String[] args) throws Exception {
Options options = new OptionsBuilder()
.include(ContainsPerformanceTest.class.getSimpleName())
.threads(6)
.forks(1)
.warmupIterations(3)
.measurementIterations(6)
.shouldFailOnError(true)
.shouldDoGC(true)
.build();
new Runner(options).run();
}
}

测试类注解说明:

  • @BenchmarkMode:表示进行Benchmark时使用的模式;AverageTime表示测试调用的平均时间。
  • @OutputTimeUnit:测试的度量时间单位;NANOSECONDS表示使用纳秒为单位。
  • @State:接受一个Scope参数表示状态的共享范围;Scope.Thread表示每个线程独享。
  • @Setup:执行Benchmark前执行,类似于JUnit@BeforeAll
  • @Benchmark:进行Benchmark的对象,类似于JUnit@Test

测试类启动参数Options说明:

  • include:benchmark所在的类名;
  • threads:每个进程中的测试线程数;
  • fork:进程数,如果为3,则JMH会fork出3个进程来测试;
  • warmupIterations:预热的迭代次数,
  • measurementIterations:实际测量的迭代次数。

2.3 测试结果

设置好参数后,就可以跑测试了。测试结果如下:

# Benchmark: ContainsPerformanceTest.arrayList

# Run progress: 0.00% complete, ETA 00:00:18
# Fork: 1 of 1
# Warmup Iteration 1: 42530.408 ±(99.9%) 2723.999 ns/op
# Warmup Iteration 2: 17841.988 ±(99.9%) 1882.026 ns/op
# Warmup Iteration 3: 18561.513 ±(99.9%) 2021.506 ns/op
Iteration 1: 18499.568 ±(99.9%) 2126.172 ns/op
Iteration 2: 18975.407 ±(99.9%) 2004.509 ns/op
Iteration 3: 19386.851 ±(99.9%) 2248.536 ns/op
Iteration 4: 19279.722 ±(99.9%) 2102.846 ns/op
Iteration 5: 19796.495 ±(99.9%) 1974.987 ns/op
Iteration 6: 21363.962 ±(99.9%) 2175.961 ns/op Result "ContainsPerformanceTest.arrayList":
19550.334 ±(99.9%) 2771.595 ns/op [Average]
(min, avg, max) = (18499.568, 19550.334, 21363.962), stdev = 988.377
CI (99.9%): [16778.739, 22321.929] (assumes normal distribution) # Benchmark: ContainsPerformanceTest.hashSet # Run progress: 50.00% complete, ETA 00:00:16
# Fork: 1 of 1
# Warmup Iteration 1: 10.662 ±(99.9%) 0.209 ns/op
# Warmup Iteration 2: 11.177 ±(99.9%) 1.077 ns/op
# Warmup Iteration 3: 9.467 ±(99.9%) 1.462 ns/op
Iteration 1: 9.540 ±(99.9%) 0.535 ns/op
Iteration 2: 9.388 ±(99.9%) 0.365 ns/op
Iteration 3: 10.604 ±(99.9%) 1.008 ns/op
Iteration 4: 9.361 ±(99.9%) 0.154 ns/op
Iteration 5: 9.366 ±(99.9%) 0.458 ns/op
Iteration 6: 9.274 ±(99.9%) 0.237 ns/op Result "ContainsPerformanceTest.hashSet":
9.589 ±(99.9%) 1.415 ns/op [Average]
(min, avg, max) = (9.274, 9.589, 10.604), stdev = 0.505
CI (99.9%): [8.174, 11.004] (assumes normal distribution) # Run complete. Total time: 00:00:32 Benchmark Mode Cnt Score Error Units
ContainsPerformanceTest.arrayList avgt 6 19550.334 ± 2771.595 ns/op
ContainsPerformanceTest.hashSet avgt 6 9.589 ± 1.415 ns/op

经过测试,发现两者耗时差异极大,ArrayList大概是20K纳秒,而HashSet则10纳秒左右。两者完全不在一个数量级上。

3 源码分析

通过测试得知两者差异极大,就小窥一下源码分析分析。

3.1 ArrayList的contains()

ArrayList的底层使用数组作为数据存储,当给定一个Object去判断是否存在,需要去遍历数组,与每个元素对比。

public boolean contains(Object o) {
return indexOf(o) >= 0;
}
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}

从源码可以发现,contains()方法是通过调用indexOf()来判断的,而后者就是需要遍历数组,直到找到那个与入参相等的元素才会停止。因为,ArrayListcontains()方法的时间复杂度为O(n),也就是说,时间取决于长度,而且是正比的关系。

3.2 HashSet的contains()

HashSet底层是通过HashMap来实现的,而HashMap的底层结构为数组+链表JDK 8后改为数组+链表+红黑树

HashMap的相关代码如下:

public boolean containsKey(Object key) {
return getNode(hash(key), key) != null;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}

首先通过获取Hash值来找,如果Hash值相等且对象也相等,则找到。一般来说,在hashCode()方法实现没问题的情况下,发生Hash冲突的情况是比较少。所以可以认为,大部分情况下,contains()的时间复杂度为O(1),元素个数不影响其速度。如果发生Hash冲突,在链表长度小于8时,时间复杂度为O(n);在链表大于8时,转化为红黑树,时间复杂度为O(logn)

一般地,我们认为,HashSet/HashMap的查找的时间复杂度为O(1)

4 总结

通过JMH测试我们发现ArrayListHashSetcontains()方法性能差异很大。经过源码分析得知,ArrayList对应的时间复杂度为O(n),而HashSet的时间度为O(1)


欢迎关注公众号<南瓜慢说>,将持续为你更新...

【Java必修课】ArrayList与HashSet的contains方法性能比较(JMH性能测试)的更多相关文章

  1. ArrayList和HashSet的Contains()方法(转)

    来源: ArrayList和HashSet的Contains()方法 笔试题: package com.champion.test.exam; import java.util.ArrayList; ...

  2. ajax与servlet交互(通过JSON),JAVA的arraylist传到前端的方法

    所实现的效果:首先从前端(ajax)传参数给servlet,然后servlet经过处理,把arraylist类型的参数以JSON字符串的形式返回给前端(ajax),然后前端经过解析,把JSON字符串解 ...

  3. org.hibernate.MappingException:Unknown entity:java.util.ArrayList

    1.错误描述 [CQ] ERROR [http-apr-8888-exec-3] com.opensymphony.xwork2.util.logging.commons.CommonsLogger. ...

  4. Java中如何克隆集合——ArrayList和HashSet深拷贝

    编程人员经常误用各个集合类提供的拷贝构造函数作为克隆List,Set,ArrayList,HashSet或者其他集合实现的方法.需要记住的是,Java集合的拷贝构造函数只提供浅拷贝而不是深拷贝,这意味 ...

  5. 【转】Java如何克隆集合——深度拷贝ArrayList和HashSet

    原文网址:http://blog.csdn.net/cool_sti/article/details/21658521 原英文链接:http://javarevisited.blogspot.hk/2 ...

  6. Java中ArrayList,Vector,LinkedList,HashMap,HashTable,HashSet对比及总结

    1.所有的集合的父类都是Collection的接口 2.Set List Map 区别 A  在Set里面:无法添加元素的顺序,所以Set里面的元素不能重复 B  在List中:有索引号,类似于数组, ...

  7. Junit 注解 类加载器 .动态代理 jdbc 连接池 DButils 事务 Arraylist Linklist hashset 异常 哈希表的数据结构,存储过程 Map Object String Stringbufere File类 文件过滤器_原理分析 flush方法和close方法 序列号冲突问题

    Junit 注解 3).其它注意事项: 1).@Test运行的方法,不能有形参: 2).@Test运行的方法,不能有返回值: 3).@Test运行的方法,不能是静态方法: 4).在一个类中,可以同时定 ...

  8. 浅谈Java语言中ArrayList和HashSet的区别

    Java语言中ArrayList和HashSet的区别 2019-04-10   13:22:49 一.基本区别 首先一起看个实例,其代码如下: package com.MrZ_baby.com; i ...

  9. Java基础——ArrayList方法全解(字典版)

    引言 在使用集合 ArrayList 的时候,经常使用add.remove等,其他的没用过,甚至没听说过的还有很多.现在在这个教程中,简单的了解一下,不要求全都记下.相当于在你脑袋里建一个索引,就是有 ...

随机推荐

  1. Spring Boot 入门之基础构建篇(一)

    博客地址:http://www.moonxy.com 一.前言 随着 Spring 的功能越来越强,在使用 Spring 的时候,门槛也变得高了起来,诸如搭建一个基于 Spring 的 Web 程序却 ...

  2. Vuex,从入门到...

    Vuex 是什么? 官方是这么说的:Vuex 是一个专为 Vue.js 应用程序开发的状态管理模式.它采用集中式存储管理应用的所有组件的状态,并以相应的规则保证状态以一种可预测的方式发生变化. 不懂? ...

  3. Docker笔记(十一):Dockerfile详解与最佳实践

    Dockerfile是一个文本文件,包含了一条条指令,每条指令对应构建一层镜像,Docker基于它来构建一个完整镜像.本文介绍Dockerfile的常用指令及相应的最佳实践建议. 1. 理解构建上下文 ...

  4. logback配置方法

    logback是一个通用可靠.快速灵活的日志框架,它替代了log4j,和slf4j组成新的日志系统. slf4j是一个日志门面,为其他各种日志框架提供了统一的接口,代码中使用slf4j可以避免对某一种 ...

  5. 夯实Java基础系列6:一文搞懂抽象类和接口,从基础到面试题,揭秘其本质区别!

    目录 抽象类介绍 为什么要用抽象类 一个抽象类小故事 一个抽象类小游戏 接口介绍 接口与类相似点: 接口与类的区别: 接口特性 抽象类和接口的区别 接口的使用: 接口最佳实践:设计模式中的工厂模式 接 ...

  6. 如何把安全证书导入到java中的cacerts证书库

    每一步:进入某个https://www.xxx.com开头的网站,把要导入的证书下载, 在该网页上右键 >> 属性 >> 点击"证书" >> 再 ...

  7. 坑爹的tp-link管理密码设置

     tp-link管理密码最长14位,我设置了15位的密码,突然等不上去,上网发现不少人也有类似情况,后来看到一个文章说tp-link管理密码,可以设置6-15,于是抱着试一试的态度,输入我设置密码的前 ...

  8. poi实现excel的导入导出功能

    Java使用poi实现excel的导入导出功能: 工具类ExcelUtil,用于解析和初始化excel的数据:代码如下 package com.raycloud.kmmp.item.service.u ...

  9. CPU的物理数、核心数、线程数

    最近了解下CPU的参数,主要是对常见的CPU参数指标:物理数.核心数以及线程数做了下了解.增长了点自己的见识,方便自己回忆和分享,记录下来.参考了网上的一些说明并加以整理,形成该随笔.主要参考链接如下 ...

  10. SUSE CaaS Platform 4 - 使用 Ceph RBD 作为持久存储(动态)

    图1 架构图 图2 各存储插件对动态供给方式的支持状况 1.所有节点安装 # yum install ceph-common 复制 ceph.conf 到 worker 节点上 # scp admin ...