作者 | 加多

关注阿里巴巴云原生公众号,后台回复关键字“并发”,即可参与送书抽奖!
**

导读:并发编程与 Java 中其他知识点相比较而言学习门槛较高,从而导致很多人望而却步。但无论是职场面试,还是高并发/高流量系统的实现,都离不开并发编程,于是能够真正掌握并发编程的人成为了市场迫切需求的人才。本文中,作者加多以通俗易懂的方式讲解了多线程并发编程从入门到实践需要掌握的理论知识与实际操作方法。

学习并发编程

Java 并发编程作为 Java 技术栈中的一根顶梁柱,其学习成本还是比较大的,很多人学习起来感到没有头绪、无从下手。那么学习并发编程是否有一些技巧在里面呢?

为了让开发者从 Java 并发编程的苦海中解脱出来,大神 Doug Lea 特意为 Java 开发人员做了一件事情,那就是在 JDK 中提供了 Java 并发包(JUC)。

该包提供了常用的并发相关的工具类,比如锁、并发安全的队列、并发安全的列表、线程池、线程同步器等。有了 JUC 包,开发人员编写并发程序的时候,就不再那么吃力了;但是工具虽好,如果你对其原理不了解,还是很容易犯错,即:不懂原理多吃亏。

下面为大家举三个例子进行说明:

  • 最简单的并发安全队列 LinkedBlockingQueue,其 offer 与 put 方法的区别。什么时候用 offer,什么时候用 put,你可能在某个时间点知道,但是过一段时间可能就会忘记。但如果你对其原理了解,翻看下代码,就可以知道:offer 是非阻塞的,队列满了,就丢弃当前元素;put 是阻塞的,队列满则会挂起当前线程进行等待;

  • 使用线程池的时候,意在让调用线程把任务放入线程池后直接返回,让任务异步执行。如果你没注意拒绝策略为 CallerRunsPolicy,并且不知道线程池队列满后,拒绝策略的执行是当前调用线程,那么你在拒绝策略里面就会做很耗时的动作,导致当前调用线程被阻塞很久;

  • 当你使用 Executors.newFixedThreadPool 等创建线程池的时候,如果你不知道其内部创建了一个无界队列,那么当大量任务被投递到创建的线程池里面后,可能就会造成 OOM(OutOfMemoryError)。另外当你不知道线程池里面的线程是用户线程还是 deamon 线程的时候,且没有调用线程池的 shutdown 方法,则创建线程池的应用也许就不能优雅退出。

上面的几个例子,意在说明虽然有了 JUC 包,但是不懂原理依然会很吃亏。那么我们为何不花些时间来研究下 JUC 包重要组件的实现原理呢?

有人可能会说:我看了但看不懂,每个组件里面涉及的知识太多了。没错, JUC 包重要组件的实现的确是由并发编程基础知识搭建起来的,所以大家在看组件实现原理前,应该先去把并发的相关基础知识学好,然后由浅入深进行研究。

比如最基础的线程基础操作原语 notify/wait 系列,join 方法、sleep 方法、yeild 方法;线程中断的理解;死锁的产生与避免;什么时候是用户线程、什么时候是 deamon 线程?什么是伪共享以及如何解决?Java 内存模型是什么?什么是内存不可见性以及如何避免?volatile 与 Synchronized 内存语义是什么,它是用来解决什么问题的?什么是 CAS 操作,它的出现为了解决什么问题?ABA 问题是什么?什么是指令重排序,如何避免?什么是原子性操作?什么是独占锁,共享锁,公平锁,非公平锁?······

如果你已经掌握了上面列出的所有基础知识,那么就可以先看 JUC 包中最简单的基于 CAS 无锁实现的原子性操作类如:AtomicLong 的实现。可能你会有所疑问:其中的变量 value 为何使用 volatile 修饰(多线程下保证内存可见性)?

接下来大家可以看到 JDK8 新增原子操作类 LongAdder,在非常高的并发请求下,AtomicLong 的性能会受影响,这是因为虽然 AtomicLong 使用无数 CAS 算法,但是 CAS 失败后还是通过无限循环的自旋锁不断尝试的。在高并发下 N 多线程同时去操作一个变量,会造成大量线程 CAS 失败,然后处于自旋状态,这大大浪费了 cpu 资源。

既然 AtomicLong 性能是由于过多线程同时去竞争一个变量的更新而降低的,那么如果把一个变量分解为多个变量,让同样多的线程去竞争多个资源,性能问题不就解决了?JDK8 提供的 LongAdder 就是这个思路。看到这里大家或许会眼前一亮。

最后大家可以去看一下,比较简单的并发安全基于写时拷贝的 CopyOnWriteArrayList 的实现,以及探究其迭代器的弱一致性实现原理(即写时拷贝)。

接下来进入核心环节,也就是对 JUC 包中锁的研究。

一开始要先把 LockSupport 类研究透,即:锁中让线程挂起与唤醒的基础设施。由于锁是基于 AQS(AbstractQueuedSynchronizer)实现的,所以肯定要先把 AQS 搞清楚。

你将会发现 AQS  中维持了一个单一的状态信息 state, 可以通过 getState,setState,compareAndSetState 函数修改其值。

对于 ReentrantLock 的实现来说,state 可以用来表示当前线程获取锁的可重入次数;对于读写锁 ReentrantReadWriteLock 来说,state 的高 16 位表示读状态,也就是获取该读锁的次数,低 16 位表示获取到写锁线程的可重入次数;对于 semaphore 来说,state 用来表示当前可用信号的个数;对于 FutuerTask 来说,state 用来表示任务状态(例如还没开始,运行,完成,取消);对于 CountDownlatch 和 CyclicBarrie 来说,state 用来表示计数器当前的值。

AQS 有个内部类 ConditionObject 是用来结合锁实现线程同步,ConditionObject 可以直接访问 AQS 对象内部的变量,比如 state 状态值和 AQS 队列。ConditionObject 是条件变量,每个条件变量对应着一个条件队列 (单向链表队列),用来存放调用条件变量的 await() 方法后被阻塞的线程。

AQS 类并没有提供可用的 tryAcquire 和 tryRelease,正如 AQS 是锁阻塞和同步器的基础框架,tryAcquire 和 tryRelease 需要有具体的子类来实现。子类在实现 tryAcquire 和 tryRelease 的时候,要根据具体场景使用 CAS 算法尝试修改状态值 state, 成功则返回 true, 否则返回 false。子类还需要定义在调用 acquire 和 release 方法的时候 ,state 状态值的增减代表什么含义。

比如继承自 AQS 实现的独占锁 ReentrantLock,定义当 status 为 0 的时候表示锁空闲;为 1 的时候表示锁已经被占用。在重写 tryAcquire 的时候,内部需要使用 CAS 算法,查看当前 status 是否为 0,如果为 0 则使用 CAS 设置为 1,并设置当前线程的持有者为当前线程,返回 true;如果 CAS 失败则返回 false。

ReentrantLock 在实现 tryRelease 的时候,内部需要使用 CAS 算法把当前 status 的值从 1 修改为 0,并设置当前锁的持有者为 null,然后返回 true, 如果 cas 失败则返回 false。

知道 AQS 是什么后,下面先看最简单的独占锁 ReentrantLock。你可以先画出其类图结构,看看有哪些变量和方法,将会发现它有着公平锁与独占锁之分(回顾基础篇)。

类图中状态值 state 代表线程获取该锁的可重入次数,当一个线程第一次获取该锁时, state 的值为 0;第二次获取后,该锁状态值为 1,这就是可重入次数。然后加大难度,看看读写锁 ReentrantReadWriteLock 是怎么实现读写分离、增加并发度的,别忘了还有 JDK 新增的 StampedLock 。

等锁研究完了,就可以对并发队列进行研究了。其中,队列要分为基于 CAS 的无阻塞队列 ConcurrentLinkedQueue  和其他基于锁的阻塞队列。先看比较简单的 ArrayBlockingQueue,LinkedBlockingQueue,ConcurrentLinkedQueue,别忘了还有高级的优先级队列 PriorityBlockingQueue 和延迟队列 DelayQueue。

好像少了线程池?线程池主要解决两个问题:

  • 当执行大量异步任务的时候,线程池能够提供较好的性能;在不使用线程池且需要执行异步任务时,直接 new 一线程进行运行,线程的创建和销毁是需要开销的。线程池里面的线程是可复用的,不会每次执行异步任务时候都重新创建和销毁线程;

  • 线程池提供了一种资源限制和管理的手段。比如可以限制线程的个数、动态新增线程等,每个 ThreadPoolExecutor 也保留了一些基本的统计数据,如:当前线程池完成的任务数目等。

前面讲解过 Java 中线程池 ThreadPoolExecutor 原理的探究,ThreadPoolExecutor 是 Executors 工具类里的一部分功能。下面介绍另外一部分功能,也就是 ScheduledThreadPoolExecutor 的实现,它是一个可以指定一定延迟时间后或者定时进行任务调度执行的线程池。

JUC 中重要的高级线程同步器 CountDownLatch、CyclicBarrier、Semaphore 也不能忽略,这些高级的同步器会大大简化我们编写线程同步任务的门槛、降低我们的出错率。

虽然 Java 并发编程内容很广,但还是有一些规则可以遵循,比如线程。线程池创建的时候要指定名称以便排查问题,线程池使用完毕记得关闭,ThreadLocal 使用完毕记得调用 remove 清理,SimpleDateFormat 类是线程不安全的等等。

总结

如果你对上面的内容感兴趣,但对学并发无从下手,那么机会来了!《Java并发编程之美》这本书,就是按照以上的思路来编写的,该书在京东上被列为 10 大精选书籍之一。

购买链接:https://item.m.jd.com/product/12450812.html


扫描下方二维码添加小助手,与 8000 位云原生爱好者讨论技术趋势,实战进阶!

进群暗号:公司-岗位-城市

关注阿里巴巴云原生公众号,后台回复关键字“并发”,即可参与送书抽奖!**

Java 并发编程-不懂原理多吃亏(送书福利)的更多相关文章

  1. java并发编程系列原理篇--JDK中的通信工具类Semaphore

    前言 java多线程之间进行通信时,JDK主要提供了以下几种通信工具类.主要有Semaphore.CountDownLatch.CyclicBarrier.exchanger.Phaser这几个通讯类 ...

  2. Java并发编程 | Synchronized原理与使用

    Java提供了多种机制实现多线程之间有需要同步执行的场景需求.其中最基本的是Synchronized ,实现上使用对象监视器( Monitor ). Java中的每个对象都是与线程可以锁定或解锁的对象 ...

  3. Java并发编程原理与实战三十一:Future&FutureTask 浅析

    一.Futrue模式有什么用?------>正所谓技术来源与生活,这里举个栗子.在家里,我们都有煮菜的经验.(如果没有的话,你们还怎样来泡女朋友呢?你懂得).现在女票要你煮四菜一汤,这汤是鸡汤, ...

  4. Java并发编程底层实现原理 - volatile

    Java语言规范第三版中对volatile的定义如下: Java编程语言允许线程访问共享变量,为了确保共享变量能被准确和一致性的更新,线程应该确保通过排他锁 单独获得这个变量. volatile有时候 ...

  5. Java并发编程:Synchronized及其实现原理

    Java并发编程系列: Java 并发编程:核心理论 Java并发编程:Synchronized及其实现原理 Java并发编程:Synchronized底层优化(轻量级锁.偏向锁) Java 并发编程 ...

  6. Java 并发编程:volatile的使用及其原理

    Java并发编程系列: Java 并发编程:核心理论 Java并发编程:Synchronized及其实现原理 Java并发编程:Synchronized底层优化(轻量级锁.偏向锁) Java 并发编程 ...

  7. Java 并发编程——Executor框架和线程池原理

    Eexecutor作为灵活且强大的异步执行框架,其支持多种不同类型的任务执行策略,提供了一种标准的方法将任务的提交过程和执行过程解耦开发,基于生产者-消费者模式,其提交任务的线程相当于生产者,执行任务 ...

  8. Java并发编程-阻塞队列(BlockingQueue)的实现原理

    背景:总结JUC下面的阻塞队列的实现,很方便写生产者消费者模式. 常用操作方法 常用的实现类 ArrayBlockingQueue DelayQueue LinkedBlockingQueue Pri ...

  9. [Java并发编程(五)] Java volatile 的实现原理

    [Java并发编程(五)] Java volatile 的实现原理 简介 在多线程并发编程中 synchronized 和 volatile 都扮演着重要的角色,volatile 是轻量级的 sync ...

随机推荐

  1. .NET使用本地outlook客户端发送邮件

    1.添加Microsoft.Office.Interop.Outlook引用 2.封装发送邮件方法 using System; using System.Configuration; using Sy ...

  2. SATA、PCIe、AHCI、NVMe

    IT 界总喜欢发明新名词.而且同一个东西,可能有几个不同的名字.同一个名字,又可能指不同的东西. 从物理接口角度来说,我们常见的有IDE(淘汰),SATA,PCIe,M.2(固态硬盘) M.2插槽是有 ...

  3. APS.NET MVC + EF (06)---模型

    在实际开发中,模型往往被划分为视图模型和业务模型两部分,视图模型靠近视图,业务模型靠近业务,但是在具体编码上,它们之间并不是隔离的. 6.1 视图模型和业务模型 模型大多数时候都是用来传递数据的.然而 ...

  4. Java学习——网络编程

    Java学习——网络编程 摘要:本文主要介绍了什么是网络编程,以及如何使用Java语言进行网络编程. 部分内容来自以下博客: https://www.cnblogs.com/renyuan/p/269 ...

  5. Java生鲜电商平台-系统报表设计与架构

    Java生鲜电商平台-系统报表设计与架构 说明:任何一个运行的平台都需要一个很清楚的报表来显示,那么作为Java开源生鲜电商平台而言,我们应该如何设计报表呢?或者说我们希望报表来看到什么数据呢?   ...

  6. Docker(二)-在Docker中部署Nginx实现负载均衡(视频教程)

    本教程介绍利用Docker部署Nginx服务实现负载均衡. (双击全屏播放)

  7. 【Qt编程】基于QWT的曲线绘制及图例显示操作——有样点的实现功能

    在<QWT在QtCreator中的安装与使用>一文中,我们完成了QWT的安装,这篇文章我们讲讲基础曲线的绘制功能. 首先,我们新建一个Qt应用程序,然后一路默认即可.这时,你会发现总共有: ...

  8. LeetCode学习_day1:原地算法

    原地算法:是一种使用小的,固定数量的额外之空间来转换资料的算法.当算法执行时,输入的资料通常会被要输出的部份覆盖掉. 范例:冒泡排序.选择排序.插入排序.希尔排序 (1)冒泡排序: 冒泡排序算法的原理 ...

  9. linux ssh免密

    1.ssh-keygen -t rsa 生产密钥 2.ssh-copy-id 192.168.44.10 发布密钥  

  10. infinity新标签页失效

    安装infinity新标签页后,无法生效,或者infinity新标签页突然失效了. 驱动精灵的问题 驱动精灵安装后,还会安装其它的软件,在卸载后,安装的软件还存在. 解决办法 光卸载驱动精灵还不够,还 ...