一口气带你踩完五个 List 的大坑,真的是处处坑啊!
点赞再看,养成习惯,微信搜索『程序通事』,关注就完事了!
点击查看更多历史文章
List 可谓是我们经常使用的集合类之一,几乎所有业务代码都离不开 List。既然天天在用,那就没准就会踩中这几个 List 常见坑。
今天我们就来总结这些常见的坑在哪里,捞自己一手,防止后续同学再继续踩坑。
本文设计知识点如下:
ArrayList 这是李逵,还是李鬼?
以前实习的时候,写过这样一段简单代码,通过 Arrays#asList
将数组转化为 List 集合。
这段代码表面看起来没有任何问题,编译也能通过,但是真正测试运行的时候将会在第 4 行抛出 UnsupportedOperationException
。
刚开始很不解,Arrays#asList
返回明明也是一个 ArrayList
,为什么添加一个元素就会报错?这以后还能好好新增元素吗?
最后通过 Debug 才发现这个Arrays#asList
返回的 ArrayList
其实是个李鬼,仅仅只是 Arrays 一个内部类,并非真正的 java.util.ArrayList
。
通过 IDEA,生成这两个的类图,如下:
从上图我们发现,add/remove
等方法实际都成自 AbstractList
,而 java.util.Arrays$ArrayList
并没有重写父类的方法。而父类方法恰恰都会抛出 UnsupportedOperationException
。
这就是为什么这个李鬼 ArrayList
不支持的增删的实际原因。
你用你的新 List,为什么却还互相影响
李鬼 ArrayList
除了不支持增删操作这个坑以外,还存在另外一个大坑,改动内部元素将会同步影响原数组。
输出结果:
arrays:[modify_1, modify_2, 3]
list:[modify_1, modify_2, 3]
从日志输出可以看到,不管我们是修改原数组,还是新 List 集合,两者都会互相影响。
查看 java.util.Arrays$ArrayList
实现,我们可以发现底层实际使用了原始数组。
知道了实际原因,修复的办法也很简单,套娃一层 ArrayList
呗!
List<String> list = new ArrayList<>(Arrays.asList(arrays));
不过这么写感觉十分繁琐,推荐使用 Guava Lists 提供的方法。
List<String> list = Lists.newArrayList(arrays);
通过上面两种方式,我们将新的 List 集合与原始数组解耦,不再互相影响,同时由于此时还是真正的 ArrayList
,不用担心 add/remove
报错了。
除了 Arrays#asList
产生新集合与原始数组互相影响之外,JDK 另一个方法 List#subList
生成新集合也会与原始 List
互相影响。
我们来看一个例子:
日志输出结果:
integerList:[10, 20, 3]
subList:[10, 20]
查看 List#subList
实现方式,可以发现这个 SubList 内部有一个 parent
字段保存保存最原始 List 。
所有外部读写动作看起来是在操作 SubList
,实际上底层动作却都发生在原始 List 中,比如 add
方法:
另外由于 SubList
实际上还在引用原始 List,业务开发中,如果不注意,很可能产生 OOM 问题。
以下例子来自于极客时间:Java业务开发常见错误100例
private static List<List<Integer>> data = new ArrayList<>();
private static void oom() {
for (int i = 0; i < 1000; i++) {
List<Integer> rawList = IntStream.rangeClosed(1, 100000).boxed().collect(Collectors.toList());
data.add(rawList.subList(0, 1));
}
}
data
看起来最终保存的只是 1000 个具有 1 个元素的 List,不会占用很大空间。但是程序很快就会 OOM。
OOM 的原因正是因为每个 SubList 都强引用个一个 10 万个元素的原始 List,导致 GC 无法回收。
这里修复的办法也很简单,跟上面一样,也来个套娃呗,加一层 ArrayList
。
不可变集合,说好不变,你怎么就变了
为了防止 List 集合被误操作,我们可以使用 Collections#unmodifiableList
生成一个不可变(immutable)集合,进行防御性编程。
这个不可变集合只能被读取,不能做任何修改,包括增加,删除,修改,从而保护不可变集合的安全。
上面最后三行写操作都将会抛出 UnsupportedOperationException
异常
但是你以为这样就安全了吗?
如果有谁不小心改动原始 List,你就会发现这个不可变集合,竟然就变了。。。
上面单元测试结果将会全部通过,这就代表 Collections#unmodifiableList
产生不可变集合将会被原始 List 所影响。
查看 Collections#unmodifiableList
底层实现方法:
可以看到这跟上面 SubList
其实是同一个问题,新集合底层实际使用了原始 List。
由于不可变集合所有修改操作都会报错,所以不可变集合不会产生任何改动,所以并不影响的原始集合。但是防过来,却不行,原始 List 随时都有可能被改动,从而影响不可变集合。
可以使用如下两种方式防止上卖弄的情况。
使用 JDK9 List#of 方法。
List<String> list = new ArrayList<>(Arrays.asList("one", "two", "three"));
List<String> unmodifiableList = List.of(list.toArray(new String[]{}));
使用 Guava immutable list
List<String> list = new ArrayList<>(Arrays.asList("one", "two", "three"));
List<String> unmodifiableList = ImmutableList.copyOf(list);
相比而言 Guava 方式比较清爽,使用也比较简单,推荐使用 Guava 这种方式生成不可变集合。
foreach 增加/删除元素大坑
先来看一段代码:
String[] arrays = {"1", "2", "3"};
List<String> list = new ArrayList<>(Arrays.asList(arrays));
for (String str : list) {
if (str.equals("1")) {
list.remove(str);
}
}
上面的代码我们使用 foreach
方式遍历 List 集合,如果符合条件,将会从集合中删除改元素。
这个程序编译正常,但是运行时,程序将会发生异常,日志如下:
java.util.ConcurrentModificationException
at java.base/java.util.ArrayList$Itr.checkForComodification(ArrayList.java:939)
at java.base/java.util.ArrayList$Itr.next(ArrayList.java:893)
可以看到程序最终错误是由 ArrayList$Itr.next
处的代码抛出,但是代码中我们并没有调用该方法,为什么会这样?
实际是因为 foreach
这种方式实际上 Java 给我们提供的一种语法糖,编译之后将会变为另一种方式。
我们将上面的代码产生 class 文件反编来看下最后代码长的啥样。
可以看到 foreach
这种方式实际就是 Iterator
迭代器实现方式,这就是为什么 foreach
被遍历的类需要实现 Iterator
接口的原因。
接着我们来看下抛出异常方法:
expectedModCount
来源于 list#iterator
方法:
也就是说刚开始遍历循环的时候 expectedModCount==modCount
,下面我们来看下 modCount
。
modCount
来源于 ArrayList
的父类 AbstractList
,可以用来记录 List 集合被修改的次数。
ArrayList#remove
之后将会使 modCount
加一,expectedModCount
与 modCount
将会不相等,这就导致迭代器遍历时将会抛错。
modCount
计数操作将会交子类自己操作,ArrayList
每次修改操作(增、删)都会使modCount
加 1。但是如CopyOnWriteArrayList
并不会使用modCount
计数。所以
CopyOnWriteArrayList
使用foreach
删除是安全的,但是还是建议使用如下两种删除元素,统一操作。
修复的办法有两种:
使用 Iterator#remove 删除元素
JDK1.8 List#removeIf
推荐使用 JDK1.8 这种方式,简洁明了。
思考
如果我将上面 foreach
代码判断条件简单修改一下:
运行这段代码,可以发现这段代码又不会报错了,有没有很意外?
感兴趣的同学可以自行研究源码,或者直接查看 @why技术的文章:
这道Java基础题真的有坑!我求求你,认真思考后再回答
这道Java基础题真的有坑!我也没想到还有续集。
总结
第一,我们不要先入为主,想当然就认为 Arrays.asList
和 List.subList
就是一个普通,独立的 ArrayList
。
如果没办法,使用了 Arrays.asList
和 List.subList
,返回给其他方法的时候,一定要记得再套娃一层真正的 java.util.ArrayList
。
第二 JDK 的提供的不可变集合实际非常笨重,并且低效,还不安全,所以推荐使用 Guava 不可变集合代替。
最后,切记,不要随便在 foreach
增加/删除元素。
最后(求点赞,求关注)
你在 List 集合使用过程还踩过什么坑,欢迎留言讨论。
我是楼下小黑哥,我们下篇文章再见~
欢迎关注我的公众号:程序通事,获得日常干货推送。如果您对我的专题内容感兴趣,也可以关注我的博客:studyidea.cn
一口气带你踩完五个 List 的大坑,真的是处处坑啊!的更多相关文章
- git 一口气带你走完git之旅
1.git是目前世界上最先进的分布式版本控制系统.svn是集成式版本控制系统,那么问题来了,什么叫分布式管理和集中式管理? 首先,svn 需要有一个中央服务器,协同开发者需要同中央服务器连接,所有的版 ...
- RabbitMq在CentOs7下的完整安装步骤,带你踩坑
1.前言 因为公司项目中用的RabbitMq来做消息处理,自己以前没有接触过,所以想自学一下.然额,光安装就花了6.7个小时才搞定,中间还换过一个版本,综合国内外博客才最终将所有安装中遇到的问题解决掉 ...
- 一口气带你读懂80年IT发展史
计算机的发展历史有多长?真正意义上的计算机诞生,距今也只有80多年的时间.80年,对于每一个人来说,是很长的时间,但对于整个历史来说,只是短短的一瞬间.这八十多年只是整段历史中的一粒尘埃罢了,但却对这 ...
- Go 语言从新手到大神:每个人都会踩的五十个坑(转)
Go语言是一个简单却蕴含深意的语言.但是,即便号称是最简单的C语言,都能总结出一本<C陷阱与缺陷>,更何况Go语言呢.Go语言中的许多坑其实并不是因为Go自身的问题.一些错误你再别的语言中 ...
- [kuangbin带你飞]专题五 并查集
并查集的介绍可以看下https://www.cnblogs.com/jkzr/p/10290488.html A - Wireless Network POJ - 2236 An earthquake ...
- [ An Ac a Day ^_^ ] [kuangbin带你飞]专题五 并查集 POJ 2236 Wireless Network
题意: 一次地震震坏了所有网点 现在开始修复它们 有N个点 距离为d的网点可以进行通信 O p 代表p点已经修复 S p q 代表询问p q之间是否能够通信 思路: 基础并查集 每次修复一个点重新 ...
- mac自带终端安装完ohmyZsh后显示乱码
修改描述文件-添加 选择新导入的 Meslo LG M Regular for Powerline
- [kuangbin带你飞]专题五 并查集 A - Wireless Network
An earthquake takes place in Southeast Asia. The ACM (Asia Cooperated Medical team) have set up a wi ...
- .net Core发布至IIS完全手册带各种踩坑
服务器环境配置 和各位大爷报告一下我的服务器环境 : Windows Server 2012 iis 8 小插曲开始: 运维大哥在昨天给了我一台新的server 0环境开始搭建 . 并且没有安装任何的 ...
随机推荐
- Tensorflow系列专题(四):神经网络篇之前馈神经网络综述
目录: 神经网络前言 神经网络 感知机模型 多层神经网络 激活函数 Logistic函数 Tanh函数 ReLu函数 损失函数和输出单元 损失函数的选择 均方误差损失函数 交叉熵损失函数 输出单元的选 ...
- macro
Hello, 宏定义魔法世界 宏只是在预处理器里进行文本替换,没有类型,不做任何类型检查,编译器可以对相同的字符串进行优化.只保存一份到 .rodata 段.甚至有相同后缀的字符串也可以优化,你可以用 ...
- sql 模块sqllit
1.创建数据库表 面对 SQLite 数据库,我们之前熟悉的 SQL 指令都可以用: >>> create_table = "create table books (tit ...
- 线程状态以及sleep yield wait join方法
前言 在日常的开发过程中,我们通过会使用Thread.sleep模拟一个耗时的任务执行过程. 在深入理解这四个方法之前,首先对线程的状态进行理解阐述. 线程概念 线程是操作系统执行任务的基本单位,处理 ...
- cento升级openssl依旧显示老版本
不久前拿到了一季度的服务器漏洞扫描报告,还是一些老生常谈的软件.按照报告上的漏洞一个个处理,开始升级openssl的时候一切都很顺利,上传源码包,解压,编译,安装,全部都没有报错.opessl --v ...
- Java系列之内部类
今天温习一下 Java 中的内部类,内部类一般有如下几种:静态内部类.成员内部类.匿名内部类和方法内部类,下文中将主要介绍静态内部类和成员内部类,主要内容如下: 概述 静态内部类 成员内部类 匿名内部 ...
- 使用Shiro+JWT完成的微信小程序的登录(含讲解)
使用Shiro+JWT完成的微信小程序的登录 源码地址https://github.com/Jirath-Liu/shiro-jwt-wx 微信小程序用户登陆,完整流程可参考下面官方地址,本例中是按此 ...
- 区分C++和Java的this
区分C++和Java的this 今天早上写C++程序的时候,我习惯性地在程序中写了如下代码 void setY(int x){ this.x = x; } 编译器给我无情地报错了.后来想想,发现是自己 ...
- Shell:Day04.笔记
grep与正则表达式: 1.grep程序 Linux下有文本处理三剑客 - - grep sed awk grep:文本 行 过滤工具 sed:文本 行 编辑器(流编辑器) awk:报告生成器(做文本 ...
- JVM 理解性学习(一)
重新学习,重新理解 1.类加载过程等 验证:.class 文件加载到 JVM 里的时候,会验证下该文件是否符合 JVM 规范. 准备:给实体类分配内存空间,以及给类变量(static 修饰)分配&qu ...