一、指令重排问题


你写的代码有可能,根本没有按照你期望的顺序执行,因为编译器和 CPU 会尝试指令重排来让代码运行更高效,这就是指令重排。

1.1 虚拟机层面

我们都知道CPU执行指令的时候,访问内存的速度远慢于 CPU 速度

为了尽可能减少内存操作带来的 CPU 空置的影响,虚拟机会按照自己的一些规则将程序编写顺序打乱:即写在后面的代码在时间顺序上可能会先执行,而写在前面的代码会后执行。

当然这样的前提是不会产生错误。不管谁先开始,总之后面的代码在一些情况下存在先结束的可能。

1.2 硬件层面

在硬件层面,CPU会将接收到的一批指令按照其规则重排序,同样是基于 CPU 速度比缓存速度快的原因。

和上一点的目的类似,只是硬件处理的话,每次只能在接收到的有限指令范围内重排序,而虚拟机可以在更大层面、更多指令范围内重排序。

1.3 数据依赖

如果两个操作访问的是同一个变量且其中有一个是写操作,那么这两个操作之间就存在数据依赖

数据依赖分为读后写、写后写、写后读。

读后写:a = b;b = 1;
写后读:a = 1;b = a;
写后写:a = 1;a = 2;

上面这几种情况,存在数据以来,当存在数据依赖的时候,重排指令就会造成程序结果错误,所以编译器和处理器会遵循数据依赖,不改变顺序。

1.4 As-If-Serial语义

基于上面的重排序原则,不管怎么重排序(编译器和处理器为了提高并行度),(单线程)程序的执行结果不能被改变

编译器,runtime 和处理器都必须遵守 as-if-serial 语义。为了遵守 as-if-serial 语义,编译器和处理器不会对存在数据依赖关系的操作做重排序,因为这种重排序会改变执行结果。

1.5 Happens-Before语义

直接翻译就是,在之前发生,本质上和 as-if-serial 一样的。

定义:如果一个操作 happens-before 另一个操作,那么意味着第一个操作的结果对第二个操作可见,而且第一个操作的执行顺序将排在第二个操作的前面。

如果重排序之后的结果,与按照happens-before关系来执行的结果一致,那么这种重排序并不非法(也就是说,JMM允许这种重排序)。

具体规则如下:

  • 程序顺序规则:一个线程中的每个操作,happens-before于该线程中的任意后续操作。
  • 监视器锁规则:对一个锁的解锁,happens-before于随后对这个锁的加锁。
  • volatile变量规则:对一个volatile域的写,happens-before于任意后续对这个volatile域的读。
  • 线程启动规则:如果线程A执行操作ThreadB.start()(启动线程B),那么A线程的ThreadB.start()操作happens-before于线程B中的任意操作。
  • 线程终结规则:如果线程A执行操作ThreadB.join()并成功返回,那么线程B中的任意操作happens-before于线程A从ThreadB.join()操作成功返回。
  • 传递性规则:如果A happens-before B,且B happens-before C,那么A happens-before C。

总结:

这么些规则总的来说就在体现一件事,也就是单线程里,程序有关的各个层面都会做指令重排的优化,而且会用这些规则来保证结果正确。


二、多线程的指令重排


如果是多线程,无法保证正确性,指令重排可能会造成结果错误。

我个人是这样理解的:多线程最大问题就是一个 先来后到 可能破坏正确性的问题,因此有同步、加锁等等机制来保障先来后到,可是指令重排让线程本身的指令乱了,就可能让整体的结果功亏一篑。

一个简单的例子:

/**
* 指令重排问题
*/
public class HappenBefore {
private static int i = 0, j = 0;
private static int a = 0, b = 0;
public static void main(String[] args) throws InterruptedException {
while (true){
i = 0;
j = 0;
a = 0;
b = 0;
Thread t1 = new Thread(()->{
a = 1;
i = b;
});
Thread t2 = new Thread(()->{
b = 1;
j = a;
});
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println("i = " + i +" ; j = " + j);
if (i == 0 && j == 0){
break;
}
}
}
}

上面程序里开了两个线程,交替赋值;join保障这两个线程都在 main 线程之前执行完,确保最后在执行完后输出。(注意并不是保证 t1 在 t2 之前执行)

线程t1 线程t2
a = 1; b = 1;
i = b; j = a;

如果没有指令重排,按照我们的分析,多线程情况下,t1 和 t2 分别执行完,或者经过cpu的调度,t1 和 t2 线程经过了切换,那么可能出现的情况是,最终的 i 和 j 为:

  • i = 0,j = 1;(t1先执行完)
  • i = 1,j = 0;(t2先执行完)
  • i = 1,j = 1;(中间线程切换了)

但是结果应该是不会出现 i = 0,j = 0 的情况的。

可是代码跑起来就会发现,会出现 i = 0,j = 0 的情况,这就是指令重排在多线程情况下带来的问题。在各自单线程里,因为没有依赖关系,所以编译器、虚拟机以及 cpu 可以进行乱序重排,最后导致了这种结果。


三、volatile 关键字


Volatile 英文翻译:易变的、可变的、不稳定的。

  1. 在之前的示例中,线程不安全的问题,我们使用线程同步,也就是通过 synchronized 关键字,对操作的对象加锁,屏蔽了其他线程对这块代码的访问,从而保证安全。
  2. 这里的 volatile 尝试从另一个角度解决这个问题,那就是保证变量可见,有说法将其称之为轻量级的synchronized

volatile保证变量可见:简单来说就是,当线程 A 对变量 X 进行了修改后,在线程 A 后面执行的其他线程能够看到 X 的变动,就是保证了 X 永远是最新的。

更详细的说,就是要符合以下两个规则:

  1. 线程对变量进行修改后,要立刻写回主内存;
  2. 线程对变量读取的时候,要从主内存读,而不是缓存。

另一个角度,结合指令重排序,volatile 修饰的内存空间,在这上面执行的指令是禁止乱序的。因此,在单例模式的 DCL 写法中,volatile 也是必须的元素。

3.1 volatile使用示例1

private static int num = 0;
public static void main(String[] args) throws InterruptedException {
new Thread(()->{
while (num == 0){ }
}).start(); Thread.sleep(1000);
num = 1;
}

代码死循环,因为主线程里的 num = 1,不能及时将数据变化更新到主存,因此上面的代码 while 条件持续为真。

因此可以给变量加上 volatile:

private volatile static int num = 0;

这样就在执行几秒后就会停止运行。

3.2 单例模式Double Checked Locking

在设计模式里的单例模式,如果在多线程的情况下,仍然要保证始终只有一个对象,就要进行同步和锁。

class DCL{
private static volatile DCL instance;
private DCL(){ } public static DCL getInstance(){
if (instance == null){//check1
synchronized (DCL.class){
if (instance == null){//check2
instance = new DCL();
}
}
}
return instance;
}
}

双重校验锁,实现线程安全的单例锁。

关于单例模式的内容,指路:单例模式讲解及8种写法

但是:volatile不能保证原子性。

3.3 原子性问题

原子操作就是这个操作要么执行完,要么不执行,不可能卡在中间。

比如在 Java 里, i = 2,这个指令是具有原子性的,而 i++ 则不是,事实上 i++ 也是先拿 i,再修改,再重新赋值给 i 。

例如你让一个volatile的integer自增(i++),其实要分成3步:

1)读取volatile变量值到local;

2)增加变量的值;

3)把local的值写回,让其它的线程可见。

这 3 步的jvm指令为:

mov    0xc(%r10),%r8d ; Load
inc %r8d ; Increment
mov %r8d,0xc(%r10) ; Store
lock addl $0x0,(%rsp) ; StoreLoad Barrier

最后一步是内存屏障

什么是内存屏障?内存屏障告诉CPU和编译器先于这个命令的必须先执行,后于这个命令的必须后执行,同时强制更新一次不同CPU的缓存,也就是通过这个操作,使得 volatile 关键字达到了所谓的变量可见性。

这个时候我们就知道,如果一个操作有好几步,如果其他的线程修改了值,将会都产生覆盖,还是会出现不安全的情况,所以, volatile 关键字本身无法保证原子性。

volatile 无法保证原子性。我们还是用两数之和来示例:

public class NoAtomic {
private static volatile int num = 0;
public static void main(String[] args) throws InterruptedException {
for (int i=0; i<100; i++){
new Thread(()->{
for (int j=0; j < 100; j++){
num++;
}
}).start();
}
Thread.sleep(3000);
System.out.println(num);
}
}

输出结果会小于预期,虽然 volatile 保证了可见性,但是却不能保证操作的原子性。因此想要保证原子性,还是得回去找 synchronized 或者使用juc下的原子数据类型。

3.4 volatile 和 synchronized 的区别

  • volatile 本质是在告诉 jvm 当前变量在寄存器(工作内存)中的值是不确定的,需要从主存中读取; synchronized 则是锁定当前变量,只有当前线程可以访问该变量,其他线程被阻塞住。
  • volatile 仅能使用在变量级别;synchronized则可以使用在变量、方法、和类级别的。
  • volatile 仅能实现变量的修改可见性,不能保证原子性;而 synchronized 则可以保证变量的修改可见性和原子性。
  • volatile 不会造成线程的阻塞;synchronized 可能会造成线程的阻塞。

不过:由于硬件层面,从工作内存到主存的更新速度已经提升的很快,加上 synchronized 的改进,也已经不用考虑太过重量的问题,所以 volatile 很少使用。

多线程的指令重排问题:as-if-serial语义,happens-before语义;volatile关键字,volatile和synchronized的区别的更多相关文章

  1. 轻量级的同步机制——volatile语义详解(可见性保证+禁止指令重排)

    目录 1.关于volatile 2.语义一:内存可见性 2.1 一个例子 2.2 java的内存模型(JMM) 2.3 happens-before规则 2.4 volatile解决内存可见性问题的原 ...

  2. volatile可见性和指令重排

    volatile关键字的2个作用 1.线程的可见性 2.防止指令重排 什么是线程的可见性? 线程的可见性 就是一个线程对一个变量进行更改操作 其他线程获取会获得最新的值. 线程在执行的行 操作主线程的 ...

  3. volatile关键字及编译器指令乱序总结

    本文简单介绍volatile关键字的使用,进而引出编译期间内存乱序的问题,并介绍了有效防止编译器内存乱序所带来的问题的解决方法,文中简单提了下CPU指令乱序的现象,但并没有深入讨论. 以下是我搭建的博 ...

  4. java多线程(4)---volatile关键字

    volatile关键字 一旦一个共享变量(类的成员变量.类的静态成员变量)被volatile修饰之后,那么就具备了两层语义: 1)保证了不同线程对这个变量进行操作时的可见性,即一个线程修改了某个变量的 ...

  5. 多线程-volatile关键字和ThreadLocal

    1.并发编程中的三个概念 原子性:一个或多个操作.要么全部执行完成并且执行过程不会被打断,要么不执行.最常见的例子:i++/i--操作.不是原子性操作,如果不做好同步性就容易造成线程安全问题. 可见性 ...

  6. Java多线程-----volatile关键字详解

       volatile原理     Java语言提供了一种稍弱的同步机制,即volatile变量,用来确保将变量的更新操作通知到其他线程.当把变量声明为volatile类型后, 编译器与运行时都会注意 ...

  7. 【java多线程】volatile 关键字

    在java线程并发处理中,有一个关键字volatile的使用目前存在很大的混淆,以为使用这个关键字,在进行多线程并发处理的时候就可以万事大吉. Java语言是支持多线程的,为了解决线程并发的问题,在语 ...

  8. Java 多线程 -- 指令重排(HappenBefore)

    指令重排是指:代码执行顺序和预期不一致. 代码运行一般步骤为: 1.从内存中获取指令解码 2.计算值 3.执行代码操作 4.把结果写回内存 而写回内存的操作比较耗时,CPU为了性能,可能不会等它完成, ...

  9. JVM内存模型、指令重排、内存屏障概念解析

    在高并发模型中,无是面对物理机SMP系统模型,还是面对像JVM的虚拟机多线程并发内存模型,指令重排(编译器.运行时)和内存屏障都是非常重要的概念,因此,搞清楚这些概念和原理很重要.否则,你很难搞清楚哪 ...

随机推荐

  1. 初学Vue.js,用 vue ui 创建项目会不会被鄙视

    全栈的自我修养: 6使用vue ui进行vue.js环境搭建 It is only with the heart that one can see rightly. What is essential ...

  2. JAVA JDBC Template的使用

    JAVA JDBC Template的使用 什么是Template? Spring框架对JDBC的简单封装.提供了一个JDBCTemplate对象简化JDBC的开发 Template使用步骤 导入ja ...

  3. JAVA实现BP神经网络算法

    工作中需要预测一个过程的时间,就想到了使用BP神经网络来进行预测. 简介 BP神经网络(Back Propagation Neural Network)是一种基于BP算法的人工神经网络,其使用BP算法 ...

  4. HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第5章CSS盒子模型

    本教程案例在线演示 有路网PC端 有路网移动端 教程配套源码资源 教程配套源码资源 div div 可定义文档中的分区(division). div 标签可以把网页分割为独立的.不同的部分. 可以看成 ...

  5. Python爆火的原因与未来|内附Python学习书籍大礼包无偿领取|

    从12年到20年,python以肉眼可见的趋势超过了java,成为了当今It界人人皆知的编程语言. python为什么这么火? 网络编程语言搜索指数 适合初学者 Python具有语法简单.语句清晰的特 ...

  6. PHP htmlspecialchars_decode() 函数

    实例 把预定义的 HTML 实体 "<"(小于)和 ">"(大于)转换为字符:高佣联盟 www.cgewang.com <?php $str ...

  7. 服务治理框架dubbo中zookeeper的使用

    Zookeeper提供了一套很好的分布式集群管理的机制,就是它这猴子那个几月层次型的目录树的数据结构,并对书中的节点进行有效的管理,从而可以设计出多种多样的分布式的数据管理模型:下面简要介绍下zook ...

  8. LVS-DR:实现VIP和RIP不在同一个网络中的集群

    目录 LVS-DR:实现VIP和RIP不在同一个网络中集群 1. router上配置ip转发,并测试 2. DR上配置VIP和转发规则 3. RS上配置arp内核参数和VIP 4. 配置HTTP访问 ...

  9. MyBatis版本升级导致OffsetDateTime入参解析异常问题复盘

    背景 最近有一个数据统计服务需要升级SpringBoot的版本,由1.5.x.RELEASE直接升级到2.3.0.RELEASE,考虑到没有用到SpringBoot的内建SPI,升级过程算是顺利.但是 ...

  10. 25-Object类的使用

    1.java.lang.Object类的说明: * 1.Object类是所Java类的根父类 * 2.如果在类的声明中未使用extends关键字指明其父类,则默认父类为java.lang.Object ...