一篇文章看懂Java并发和线程安全（一）

一、前言

长久以来，一直想剖析一下Java线程安全的本质，但是苦于有些微观的点想不明白，便搁置了下来，前段时间慢慢想明白了，便把所有的点串联起来，趁着思路清晰，整理成这样一篇文章。

二、导读

1、为什么有多线程？

2、线程安全描述的本质问题是什么？

3、Java内存模型(JMM)数据可见性问题、指令重排序、内存屏障

三、揭晓答案

1、为什么有多线程

谈到多线程，我们很容易与高性能画上等号，但是并非如此，举个简单的例子，从1加到100，用四个线程计算不一定比一个线程来得快。因为线程的创建和上下文切换，是一笔巨大的开销。

那么设计多线程的初衷是什么呢？来看一个这样的实际例子，计算机通常需要与人来交互，假设计算机只有一个线程，并且这个线程在等待用户的输入，那么在等待的过程中，CPU什么事情也做不了，只能等待，造成CPU的利用率很低。如果设计成多线程，在CPU在等待资源的过程中，可以切到其他的线程上去，提高CPU利用率。

现代处理器大多含有多个CPU核心，那么对于运算量大任务，可以用多线程的方式拆解成多个小任务并发的执行，提高计算的效率。

总结起来无非两点，提高CPU的利用率、提高计算效率。

2、线程安全的本质

我们先来看一个例子：

public class Add {

    private int count = 0;

    public static void main(String[] args) {

        CountDownLatch countDownLatch = new CountDownLatch(4);

        Add add = new Add();

        add.doAdd(countDownLatch);

        try {

            countDownLatch.await();

        } catch (InterruptedException e) {

            e.printStackTrace();

        }

        System.out.println(add.getCount());

    }

    public void doAdd(CountDownLatch countDownLatch) {

        for (int i = 0; i < 4; i++) {

            new Thread(new Runnable() {

                public void run() {

                    for (int j = 0; j < 25; j++) {

                        count++;

                    }

                    countDownLatch.countDown();

                }

            }).start();

        }

    }

    public int getCount() {

        return count;

    }

}

上面是一个把变量自增100次的例子，只不过用了4个线程，每个线程自增25次，用CountDownLatch等4个线程执行完，打印出最终结果。实际上，我们希望程序的结果是100，但是打印出来的结果并非总是100。

这就引出了线程安全所描述的问题，我们先用通俗的话来描述一下线程安全：

线程安全就是要让程序运行出我们想要的结果，或者话句话说，让程序像我们看到的那样执行。

解释一下我总结的这句话，我们先new出了一个add对象，调用了对象的doAdd方法，本来我们希望每个线程有序的自增25次，最终得到正确的结果。如果程序增的像我们预先设定的那样运行，那么这个对象就是线程安全的。

下面我们来看看Brian Goetz对线程安全的描述：当多线程访问一个对象时，如果不用考虑这些线程在运行时环境下的调度和交替，也不需要进行额外的同步，或者在调用方进行任何其他的协调操作，调用这个对象的行为都可以获得正确的结果，那么这个对象就是线程安全的。

下面我们就来分析这段代码为什么不能确保总是得到正确的结果。

3、Java内存模型(JMM)数据可见性问题、指令重排序、内存屏障

先从计算机的硬件效率说起，CPU的计算速度比内存快几个数量级，为了平衡CPU和内存之间的矛盾，引入的高速缓存，每个CPU都有高速缓存，甚至是多级缓存L1、L2和L3，那么缓存与内存的交互需要缓存一致性协议，这里就不深入讲解。那么最终处理器、高速缓存、主内存的交互关系如下：

那么Java的内存模型（Java Memory Model，简称JMM）也定义了线程、工作内存、主内存之间的关系，非常类似于硬件方面的定义。

这里顺带提一下，Java虚拟机运行时内存的区域划分

方法区：存储类信息、常量、静态变量等，各线程共享

虚拟机栈：每个方法的执行都会创建栈帧，用于存储局部变量、操作数栈、动态链接等，虚拟机栈主要存储这些信息，线程私有

本地方法栈：虚拟机使用到的Native方法服务，例如c程序等，线程私有

程序计数器：记录程序运行到哪一行了，相当于当前线程字节码的行号计数器，线程私有

堆：new出的实例对象都存储在这个区域，是GC的主战场，线程共享。

所以对于JMM定义的主内存，大部分时候可以对应堆内存、方法区等线程共享的区域，这里只是概念上对应，其实程序计数器、虚拟机栈等也有部分是放在主内存的，具体看虚拟机的设计。

好了，了解了JMM内存模型，我们来分析一下，上面的程序为什么没得到正确的结果。请看下图，线程A、B同时去读取主内存的count初始值存放在各自的工作内存里，同时执行了自增操作，写回主内存，最终得到了错误的结果。

我们再来深入分析一下，造成这个错误的本质原因：

（1）、可见性，工作内存的最新值不知道什么时候会写回主内存

（2）、有序性，线程之间必须是有序的访问共享变量，我们用“视界”这个概念来描述一下这个过程，以B线程的视角看，当他看到A线程运算好之后，把值写回之内存之后，马上去读取最新的值来做运算。A线程也应该是看到B运算完之后，马上去读取，在做运算，这样就得到了正确的结果。

接下来，我们来具体分析一下，为什么要从可见性和有序性两个方面来限定。

给count加上volatile关键字，就保证了可见性。

private volatile int count = 0;

volatile关键字，会在最终编译出来的指令上加上lock前缀，lock前缀的指令做三件事情

（1）、防止指令重排序（这里对本问题的分析不重要，后面会详细来讲）

（2）、锁住总线或者使用锁定缓存来保证执行的原子性，早期的处理可能用锁定总线的方式，这样其他处理器没办法通过总线访问内存，开销比较大，现在的处理器都是用锁定缓存的方式，在配合缓存一致性来解决。

（3）、把缓冲区的所有数据都写回主内存，并保证其他处理器缓存的该变量失效

既然保证了可见性，加上了volatile关键词，为什么还是无法得到正确的结果，原因是count++，并非原子操作，count++等效于如下步骤：

（1）、从主内存中读取count赋值给线程副本变量：

temp=count

（2）、线程副本变量加1

temp=temp+1

（3）、线程副本变量写回主内存

count=temp

就算是真的严苛的给总线加锁，导致同一时刻，只能有一个处理器访问到count变量，但是在执行第（2）步操作时，其他cpu已经可以访问count变量，此时最新运算结果还没刷回主内存，造成了错误的结果，所以必须保证顺序性。

那么保证顺序性的本质，就是保证同一时刻只有一个CPU可以执行临界区代码。这时候做法通常是加锁，锁本质是分两种：悲观锁和乐观锁。如典型的悲观锁synchronized、JUC包下面典型的乐观锁ReentrantLock。

总结一下：要保证线程安全，必须保证两点：共享变量的可见性、临界区代码访问的顺序性。

一篇文章看懂Java并发和线程安全（一）的更多相关文章

一篇文章看懂Java并发和线程安全
一.前言长久以来,一直想剖析一下Java线程安全的本质,但是苦于有些微观的点想不明白,便搁置了下来,前段时间慢慢想明白了,便把所有的点串联起来,趁着思路清晰,整理成这样一篇文章. 二.导读 1.为什 ...
一篇文章看懂java反射机制（反射实例化对象-反射获得构造方法,获得普通方法,获得字段属性）
Class<?> cls = Class.forName("cn.mldn.demo.Person"); // 取得Class对象传入一个包名+类名的字符串就可以得到C ...
一篇文章看懂JS闭包，都要2020年了，你怎么能还不懂闭包？
壹 ❀ 引我觉得每一位JavaScript工作者都无法避免与闭包打交道,就算在实际开发中不使用但面试中被问及也是常态了.就我而言对于闭包的理解仅止步于一些概念,看到相关代码我知道这是个闭包,但闭包 ...
一篇文章看懂angularjs component组件
壹 ❀ 引我在 angularjs 一篇文章看懂自定义指令directive 一文中详细介绍了directive基本用法与完整属性介绍.directive是个很神奇的存在,你可以不设置templa ...
angularjs 一篇文章看懂自定义指令directive
壹 ❀ 引在angularjs开发中,指令的使用是无处无在的,我们习惯使用指令来拓展HTML:那么如何理解指令呢,你可以把它理解成在DOM元素上运行的函数,它可以帮助我们拓展DOM元素的功能.比如 ...
一篇文章读懂Java类加载器
Java类加载器算是一个老生常谈的问题,大多Java工程师也都对其中的知识点倒背如流,最近在看源码的时候发现有一些细节的地方理解还是比较模糊,正好写一篇文章梳理一下. 关于Java类加载器的知识,网上 ...
一篇文章弄懂 Java 反射的使用
说到Java反射,必须先把 Java 的字节码搞明白了,也就是 Class , 大 Class 在之前的文章中,我们知道了Java的大Class就是类的字节码,就是一个普通的类,里面保存的是类的信息, ...
一篇文章看懂spark 1.3+各版本特性
Spark 1.6.x的新特性Spark-1.6是Spark-2.0之前的最后一个版本.主要是三个大方面的改进:性能提升,新的 Dataset API 和数据科学功能的扩展.这是社区开发非常重要的一个 ...
Java多线程详解——一篇文章搞懂Java多线程
目录 1. 基本概念 2. 线程的创建和启动 2.1. 多线程实现的原理 2.2.多线程的创建,方式一:继承于Thread类 2.3.多线程的创建,方式一:创建Thread匿名子类(也属于方法一) 2 ...

随机推荐

Spring、SpringMVC和Springboot的区别
spring boot就是一个大框架里面包含了许许多多的东西,其中spring就是最核心的内容之一,当然就包含spring mvc. spring mvc 是只是spring 处理web层请求的一个模 ...
Codeforces Round #578 (Div. 2) Solution
Problem A Hotelier 直接模拟即可~~ 复杂度是$O(10 \times n)$ # include<bits/stdc++.h> using namespace std; ...
[LOJ3109][TJOI2019]甲苯先生的线段树：DP
分析首先,请允许我 orz HN队长zsy.链接我们发现树上的链有两种类,一类是直上直下的,一类不是直上直下的(废话).并且,如果我们确定了左侧和右侧的链的长度和整条链上所有节点的编号之和,那么这 ...
Android_(控件)动态添加或删除Spinner下拉菜单
使用ArrayList动态数组的依赖性实现动态增减Spinner下拉菜单选项功能. 设置一个EditText输入框,当用户输入了文字并单击[添加]按钮的同时,就会将输入的值添加Spinner至下拉菜单 ...
IDEA下从零开始搭建SpringBoot工程
SpringBoot的具体介绍可以参看其他网上介绍,这里就不多说了,就这几天的学习,个人理解,简而言之: (1)它是Spring的升级版,Spring容器能做到的事情,它都能做到,而且更简便,从配置形 ...
apache的httpclient进行http的交互处理
使用apache的httpclient进行http的交互处理已经很长时间了,而httpclient实例则使用了http连接池,想必大家也没有关心过连接池的管理.事实上,通过分析httpclient源码 ...
TreeMap、HashMap、LindedHashMap的区别
LinkedHashMap可以保证HashMap集合有序.存入的顺序和取出的顺序一致.TreeMap实现SortMap接口,能够把它保存的记录根据键排序,默认是按键值的升序排序,也可以指定排序的比较器 ...
centos6 centos7 配置开机启动服务
centos 6 :使用chkconfig命令即可. 我们以apache服务为例: #chkconfig --add apache 添加nginx服务 #chkconfig apache on 开机自 ...
extentsreport testng美化报告生成
一:主要内容优化testng测试报告,使用extentsreport 解决extentsreport打开后加载不出来样式的问题二:报告效果先上图,看下testng extentsreport报告 ...
阿里镜像源配置yum
通过more /etc/*release* 查看系统版本 (需要下载对应的系统版本) mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/Cen ...

一篇文章看懂Java并发和线程安全（一）

一篇文章看懂Java并发和线程安全（一）的更多相关文章

随机推荐

热门专题