全文共计7362个字,46张图。分析的较为详尽,并进行了相关知识点的扩展,所以篇幅较长,建议慢慢阅读。
本文目录
一.题是什么题?
二.阿里Java开发规范。
- 2.1 正例代码。
- 2.2 反例代码。
三.层层揭秘,为什么发生异常了呢?
- 3.1 第一层:异常信息解读。
- 3.2 第二层:抛出异常的条件解读
- 3.3 第三层:什么是modCount?它是干啥的?什么时候发生变化?
- 3.4 第四层:什么是expectedModCount?它是干啥的?什么时候发生变化?
- 3.5 第五层:组装线索,直达真相。
四.这题的坑在哪?
- 4.1 回头再看。
- 4.2 还有一个骚操作。
五.线程安全版的ArrayList。
六.总结一下。
七.回答另外一个面试题。
八.扩展阅读。
- 7.1 fail-fast机制和safe-fast机制。
- 7.2 Java语法糖。
- 7.3 阿里Java开发手册。
九.最后说一句。
一.题是什么题?
我第一次遇到这个题的时候,是在一个微信群里,阿里著名的"Java劝退师"小马哥抛出了这样的一个问题:
然后大家纷纷给出了自己的见解(注:删除了部分聊天记录):
后面在另外的群里聊天的时候(注:删除了部分聊天记录),我也抛出了这样的问题:
总结一下图片中的各种回答:
- 1.什么也不会发生,remove之后,list中的数据会被清
- 2.remove的方法调用错误,入参应该是index(数组下标)。
- 3.并发操作的时候会出现异常。
- 4.会发生ConcurrentModifyException。
你的答案又是什么呢?
在这里,我先不说正确的答案是什么,也先不评价这些回答是对是错,我们一起去探索真相,寻找答案。
二.阿里Java开发规范
有人看到题的第一眼(没有认真读题),就想起了阿里java开发手册(先入为主),里面是这样说的:
正是因为大多数人都知道并且读过这个规范(毕竟是业界权威)。所以呼声最高的答案是【会发生ConcurrentModifyException】。因为他们知道阿里java开发手册里面是强制要求:
不要在foreach循环里面进行元素的remove/add操作。remove元素请使用Iterator方式,如果并发操作,需要对Iterator对象加锁。
但是不能因为他是权威,我们就全盘接受吧?
2.1 正例代码
所以我们眼见为实,先把手册里面提到的【正例代码】跑一下,如下:
细心的读者可能发现了:咦,这个代码的22行为啥颜色不一样呢?
我帮你看看。
替换之后的代码是这样的:
从上面我们可以得到一个结论.......
等等,到这一步你就想得到结论了?
你不对【一行代码为什么就替换了七行代码】好奇吗?
看到真相的时候,有时候再往前一步就是本质了。
源码之下无秘密,我再送你一张图,JDK1.8中Collection.removeIf的源码:
好了,已经到源码级别了,从这里我们验证了,阿里java开发手册里面的正例是对的,而且我还想给他加上一句:
如果你的JDK版本是1.8以上,没有并发访问的情况下,可以使用Collection.removeIf(Predicate<? super E> filter)方法。使代码更加优雅。
2.2 反例代码
接下来我们看看【反例代码】的运行结果:
从执行结果来看,和我们预期的结果是一致。看着没有问题呀?
但是你别忘了,下面还有一句话啊:
我们执行试一试:
什么情况?真的是"出乎意料"啊!
把删除元素的条件从【公众号】修改为【why技术】就发生了异常:java.util.ConcurrentModificationException
三.层层揭秘,为什么发生了异常呢?
我们现在明白为什么阿里强制要求不要在foreach循环里面进行元素的remove/add操作,因为会发生异常了。
但是开发手册里面并没有告诉你,为什么会发生异常。需要我们自己层层深入,积极探索。
3.1 第一层:异常信息解读
所以这一小节我们就一起探索,为什么会发生异常。我们再解析一下程序的运行结果,如下:
正如上图里面异常信息的体现,异常是在代码的第21行触发的。而代码的第21行,是一个foreach循环。foreach循环是Java的语法糖,我们可以从编译后的class文件中看出,如下图所示:
请注意图中的第26行代码:
list.remove(item) (这句话很关键!!!)
很关键,很重要,后面会讲到。
这也解释了,异常信息里面的这一个问题:
好了,到这一步,我们把异常信息都解读完毕了。
3.2 第二层:抛出异常的条件解读
我再看看真实抛出异常的那一个方法:
很简单,很清晰的四行代码。抛出异常的条件是:
modCount !=expectedModCount
所以,我们需要解开的下两层面纱就是下面两大点:
- 第一:什么是modCount?它是干啥的?什么时候发生变化?
- 第二:什么是expectedModCount?它是干啥的?什么时候发生变化?
3.3 第三层:什么是modCount?它是干啥的?什么时候发生变化?
先来第一个:什么是modCount?
modCount上的注释很长,我只截取了最后一段。在这一段中,提到了几个关键点。
- 1.modCount这个字段位于java.util.AbstractList抽象类中。
- 2.modCount的注释中提到了"fail-fast"机制。
- 3.如果子类希望提供"fail-fast"机制,需要在add(int,E)方法和remove(int)方法中对这个字段进行处理。
- 4.从第三点我们知道了,在提供了"fail-fast"机制的容器中(比如ArrayList),除了文中示例的remove(Obj)方法会导致ConcurrentModificationException异常,add及其相关方法也会导致异常。
知道了什么是modCount。
那modCount是干啥的呢?
在提供了"fail-fast"机制的集合中,modCount的作用是记录了该集合在使用过程中被修改的次数。
证据就在源码里面,如下:
这是java.util.ArrayList#add(int, E)方法的源码截图:
这是java.util.ArrayList#remove(int)方法的源码截图:
注:这里不讨论手动设置为null是否对GC有帮助,我个人认为,在这里有这一行代码并没有坏处。在实际开发过程中,一般不需要考虑到这点。
同时,上面的源码截图也回答了这一层的最后一个问题:它什么时候被修改?
拿ArrayList来说,当调用add相关和remove相关方法时,会触发modCount++操作,从而被修改。
好了,通过上面的分析,我们知道了什么是modCount和modCount是干啥的。准备进入第四层。
3.4 第四层:什么是expectedModCount?它是干啥的?什么时候发生变化?
接下来:什么是expectedModCount?
expectedModCount是ArrayList中一个名叫Itr内部类的成员变量。
第二问:expectedModCount它是干啥的:
它代表的含义是在这个迭代器中,预期的修改次数
第三问:expectedModCount什么时候发生变化?
情况一:从上图中也可以看出当Itr初始化的时候,会对expectedModCount字段赋初始值,其值等于modCount。
情况二:如下图所示,调用Itr的remove方法后会再次把modCount的值赋给expectedModCount。
换句话说就是:调用迭代器的remove会维护expectedModCount=modCount。(这句话很关键!!!)
好了分析到了这里,我们知道了下面这个六连击:
- 1.什么是modCount?
- 2.modCount是干啥的?
- 3.modCount什么时候发生变化?
- 4.什么是expectedModCount?
- 5.expectedModCount是干啥的?
- 6.expectedModCount什么时候发生变化?
3.5 第五层:组装线索,直达真相
为什么发生了异常呢?
如果说前四层是线索的话,真相其实已经隐藏在线索里面了。我带你梳理一下:
【第一层:异常信息解读】中说到:
【第二层:抛出异常的条件解读】中说到:
【第三层:什么是modCount?它是干啥的?什么时候发生变化?】中说到:
【第四层:什么是expectedModCount?它是干啥的?什么时候发生变化?】中说到:
为什么发生了异常呢?
我想你大概已经有了一个答案了,我再去Debug一下,为了方便演示,我们去掉语法糖,程序修改如下:
并确认一下这个循环体会执行三次,如下:
第一次循环:
第一次循环取出的【公众号】,不满足条件if("why技术".equals(item)),不会触发list.remove(Obj)方法。
第二次循环:
如图所示,第二次循环取到了“why技术”。满足条件if("why技术".equals(item)),会触发list.remove(Obj)方法,如下所示:
第三次循环:
总结一下在foreach循环里面进行元素的remove/add操作抛出异常的真相:
因为foreach循环是Java的语法糖,经过编译后还原成了迭代器。
但是从经过编译后的代码的第26行可以看出,remove方法的调方是list,而不是迭代器。
经过前面的源码分析我们知道,由于ArrayList的"fail-fast"机制,调用remove方法会触发【modCount++】操作,对expectedModCount没有任何操作。只有调用迭代器的remove方法,才会维护expectedModCount=modCount。
所以调用了list的remove方法后,再调用Itr的next方法时,导致了expectedModCount!=modCount,抛出异常。
四.这题的坑在哪里?
前面讲了阿里开发手册。讲了在foreach循环里面进行元素的remove/add为什么会发生异常。有了这些铺垫之后。
4.1 回头再看
我们再回过头来看小马哥出的这个题:
我靠,这乍一看,foreach循环里面调用list.remove(obj)。我们刚刚分析过,会抛出ConcurrentModificationException异常。
你要这样答,你就进了小马哥的坑了。
这个题的坑在这三个点里面。小马哥并没有说这个list是ArrayList吧?如果你没有认真审题,先入为主的默认了这个list就是ArrayList。第一步就错了。
这是真正的高手,借力打力。借阿里开发手册的力,让你第一步就走错。
请看下面这张图:
当使用CopyOnWriteArrayList的时候,程序正常执行。
4.2 还有一个骚操作
既然我们知道为什么会抛出异常,也知道怎么不抛出异常,List本来就是一个接口,那我们是不是可以实现这个接口,弄一个自定义的List呢?
比如下面的这个WhyTechnologyList,就是我自己的List,狸猫换太子,这操作,够"骚"啊。
只有掌握了原理,我们想怎么玩就怎么玩。
五.线程安全版的ArrayList
CopyOnWriteArrayList是什么?我们看一下源码注释上面是怎么说的:
相对于ArrayList而言,CopyOnWriteArrayList集合是线程安全的容器。在遍历的时候,由于它操作是数组的"快照","快照"不会发生变化。所以它不需要额外加锁,也不会抛出ConcurrentModificationException异常。
我们主要看一下,示例程序中用到的三个方法,add(E e)、next()、remove(Obj)
先看add(E e)方法:
我们看一下它的next()方法:
再看一下它的remove(Obj)方法:
next、remove都是操作的快照,并没有看到ArrayList里面的modCount和expectedModCount。所以它没有抛出ConcurrentModificationException
之前看小马哥说的这句话的时候还不太明白集合和一致性之间的关系(老问题,还是先入为主,一说到一致性首先想到的是缓存和数据库之间的一致性)。
但是当我阅读源码,从add方法可以看出CopyOnWriteArrayList并不保证数据的实时一致性。只能保证最终一致性。
同时我们从源码中可以看出CopyOnWriteArrayList增删改数据的时候需要搞一个"快照",这一点是比较耗内存的,使用过程中需要注意。
六.总结一下
我们再回到最开始的地方,看看大家的回答:
- 1.什么也不会发生,remove之后,list中的数据会被清空。
- 2.remove的方法调用错误,入参应该是index(数组下标)。
- 3.并发操作的时候会出现异常。
- 4.会发生ConcurrentModifyException。
现在,你知道这些回答的问题在哪里了吧?这一部分的总结也很简单,上一个对比图就好了,如果看不清楚,你可以点开看大图:
七.回答另外一个面试题
现在面试官经常问的一个问题,你读过源码吗?
咦,巧了。你看了这篇文章,就相当于了读了ArrayList和CopyOnWriteArrayList的部分源码。
那你就可以这样回答啦:我之前看阿里Java开发手册的时候看到一条规则是不要在foreach循环里面进行元素的remove/add操作。remove元素请使用Iterator方式,如果并发操作,需要对Iterator对象加锁。
我对这条规则很感兴趣,所以我对其进行了深入的研究,阅读了ArrayList和CopyOnWriteArrayList的部分源码。
如果碰巧面试官也读过这块源码,这个问题,你们可以相谈甚欢。
如果面试官没有读过这块源码,你可以给他讲的明明白白。
当然,还有一个前提是:我希望你读完这篇文章后,如果是第一次知道这个知识点,那你可以自己实际操作一下。
看懂了是一回事,自己再实际操作一下,是另外一回事。
八.扩展阅读
8.1 fail-fast和safe-fast机制
文中多次提到了"fail-fast"机制(快速失败),与其对应的还有"safe-fast"机制(失败安全)。
这种机制是一种思想,它不仅仅是体现在Java的集合中。在我们常用的rpc框架Dubbo中,在集群容错时也有相关的实现。
Dubbo 主要提供了这样几种容错方式:
- Failover Cluster - 失败自动切换
- Failfast Cluster - 快速失败
- Failsafe Cluster - 失败安全
- Failback Cluster - 失败自动恢复
- Forking Cluster - 并行调用多个服务提供者
如果对这两种机制感兴趣的朋友可以查阅相关资料,进行了解。如果想要了解Dubbo的集群容错机制,可以看官方文档。
8.2 Java语法糖
文中说到foreach循环的时候提到了Java的语法糖。如果对这一块有兴趣的读者,可以在网上查阅相关资料,也可以看看《深入理解Java虚拟机》的第10.3节,有专门的介绍。
书中说到:
总而言之,语法糖可以看做是编译器实现的一些“小把戏”,这些“小把戏”可能会使得效率“大提升”,但我们也应该去了解这些“小把戏”背后的真实世界,那样才能利用好它们,而不是被它们所迷惑。
8.3 阿里Java开发手册
阿里的孤尽大佬作为主要作者写的这本《阿里Java开发手册》,可以说是呕心沥血推出的业界权威,非常值得阅读。读完此书,你不仅能够获得很多干货,甚至你还能读出一点技术情怀在里面。
对于技术情怀,孤尽大佬是这样的说的:
热爱、思考、卓越。热爱是一种源动力,而思考是一个过程,而卓越是一个结果。如果给这三个词加一个定语,使技术情怀更加立体、清晰地被解读,那就是奉献式的热爱,主动式的思考,极致式的卓越。
九.最后说一句
这篇文章写之前我一直在纠结,因为感觉这个知识点其实我已经掌握了,那我还有写的必要吗?我在写的这个过程中还能收获一些东西吗?
但是在写的过程中,我翻阅了大量的源码,虽然之前已经看过,但是没有这样一行一行仔细的去分析。之前只是一个大概的模糊的影像,现在具象化清晰了起来,在这个过程中,我还是学到了很多很多。
好了,看到了这里了,如果你觉得文章还不错,关注一下我的公众号[why技术]吧,文章写好后第一时间会先发布在公众号里面。
写文章很累的,需要一点正反馈。你的关注,就是强有力的正反馈!
才疏学浅,难免会有纰漏,如果你发现了错误的地方,还请你留言给我指出来,我对其加以修改。
抱拳了,铁子!
评论区