理解 Java 内存模型的因果性约束

欢迎讨论

欢迎加入技术交流群186233599讨论交流,也欢迎关注笔者公众号:风火说。

规范理解

这部分的内容比较抽象,首先是一开始的定义,如下

红色下划线的内容应该是理解的关键。首先,E 是一个特定的执行序列,其由指令集合 A 以及用于对集合 A 内部存在的 PO,SO,SW,HB 排序构成。Ci 是被 E 包含的一个子集,也就是说 Ci 中的指令全部都在执行 E 的指令集合 A 中存在。

来看第二,第三和第四个红线(忽略A是无限集合的情况,无限集合意味着线程出现了死循环,永不终止,这并不是一个合理的程序),这三者合在一起理解,可以认为是 Ci 增加一个指令,就构成了 Ci+1,也就形成了新的 Ai+1 。而新的 Ai+1 结合 PO,SO,SW,HB 关系就成为了新的 Ei+1

接着来看后续的定义

这 5 个约束合在一起实际上是说明如何构成一个 C 集合。简单而言,Ci 是 Ai的一个子集,并且这个子集和执行轨迹Ei 拥有相同的 HB,SO 关系,且 Ci 中写入操作的写入值和 Ei 中相同,Ci 中对写入值的观察结果和 Ei 中相同。而 Ei 是逐步构成 E 的第 i 步骤,最终 En 等同于 E 。这实际上约束了 C 是如何构成的,它并不是凭空而来,而是不断的将 E 中的指令添加到 C 之中,并且这些添加的指令都和 E 拥有相关的观察效果,写入值,以及偏序关系。通过确保一系列的 Ei 都是合法的,最终确定 E 是合法的。

再来剩下的两条规则

第 6 条规则定义了要往集合 C 中添加读取指令时,该指令的观察结果。换句话说集合 Ci-1 中的写入操作产生的效果,能被任意未添加到该集合中的写入操作观察到。

第 7 条规则和上面的 5 条规则相同,也是在明确在集合 C 中产生的观察效果在执行轨迹 E 中也是存在的。

7个规则都在描述在集合 C 中的写入值,读取结果,指令排列顺序都是和 E 等同,因此通过不断的构建 Ci ,最终 Cn 等同于 An ,再加上在 Cn 中的写入值,读取结果,指令排列顺序,就构成了最终的 E 。而如果这一系列的 Ci 都是“合法”的话,则最终的执行轨迹 E 也是合法的。

当我们需要向集合新增一个读取指令时,其读取到的值只能在该集合中的写入值。提交指令到集合中时,如果存在HB 关系 或依赖关系的语句阻止其提交,则提交不能成功。

例子练习

例子1

首先来看一段代码,如下

nonvolatile global int a = 0, b = 0;
ThreadA()
{
int aL = a;
if(aL == 1) b = 1;
}
ThreadB()
{
int bL = b;
if(bL == 1) a = 1;
}

对于内存模型而言,其只关注操作内存的指令,在执行轨迹 E 的 A 集合的内容是

int aL = a;
b = 1;
bL = b;
a = 1;

由于int aL = a;a = 1;不存在 HB 关系,因此可以通过数据竞争的方式读取到该写入值,也就是aL的值是 1 。bL = b;b = 1;不存在 HB 关系,因此可以通过数据竞争的方式读取到该写入值,也就是bL的值是 1 。

一个读取操作可以读取的到值或者是通过 HB 关系得到,或者是通过数据竞争得到。也就是说,在没有 HB 关系阻止该读取结果时,该读取结果是允许的,这被称之为 HB 一致性。显然,上面的输出结果aL==bL==1是符合 HB 一致性的。

然而从顺序一致性执行的角度而言,这种输出结果就好像是因为aL读取到线程 B 写入的值,产生了b=1的结果,而这个结果导致了bL==1的结果,而这个结果导致了a=1的结果,而a==1导致了aL=1。形成了一个循环,显然这是违背直觉的。而 JMM 中因果性的要求就是用来判定这种执行轨迹是否合法的依据。

再用因果性分析这个执行之前,我们先看另外一个更简单一些的例子,代码如下

0: x == y == 0

Thread 1:
1: r1 = x;
2: y = 1; Thread 2:
3: r2 = y;
4: x = r2;

这个例子反复出现,显然我们知道r1==r2==1是一个合法的输出结果。因为重排序的原因,y=1被执行,而后r2=y观察到这个写入,x=r2同样得到值 1,r1=x观察到这个写入。下面我们使用因果性来分析这个执行轨迹。

首先我们将集合 C 中添加指令 2 。与指令 2 存在 HB 关系的是指令 0 和 1 。他们都不会阻止指令 2 的发生,因此指令 2 被允许添加到集合 C 中,此时有 C1

我们用 W(variable,value) 来表达对一个变量 variable 写入 value 的值,用 R(variable,value) 表达从变量 variable 中读取到 value 的值。

因此目前我们有 C0= {W(x,0),W(y,0)} 的初始状态。而 C1=C0 U {W(y,1)} 。然后我们添加指令 3 到 C1 中,按照 HB 关系,指令观察到的值应该是指令 0 写入的。但是同时,它也允许观察到提交集合中已经写入的值,也就是存在于提交集合中指令 2 的写入值。因此我们有 C2=C1 U {R(y,1)} 。

接着我们提交指令 4 ,显然此时有 C3=C2 U {W(x,1)} 。

最后我们提交指令 1,按照 HB 关系,此时允许的观察值由指令 0 写入,也就是 0 。与上述相同,允许其观察到在提交集合中的写入值,因此 C4=C3 U {R(x,1)} 。

C4=A4,C4 中的写入值,读取值,排列顺序都与 E4 相同,也与 E 相同。因此判定该执行轨迹是合法的,其表现是符合 JMM 要求的。

接下来我们回到最开始的例子,如果我们要得到bL==1的结果,意味着我们需要执行b=1这个指令。而要执行该指令,我们需要执行int aL = a;指令并且读取到值 1 。注意,因果性的判断是需要考虑条件判断因素的,而 HB 一致性则不考虑,它仅仅是提取所有的可能执行指令并且假定其执行。

从提交集合的角度出发,我们需要提交int aL = a;实际上是想提交 R(a,1) 。但是 C0={W(x,0),W(y,0)} ,C1 中的读取操作的读取值只能由 C0 中的写入造成,因此 R(a,1) 无法被提交到 C1 中。这就意味着达成a==b==1的提交集合不合法,因此对应的执行轨迹也是非法的。所以这种结果不被 JMM 允许。

例子2

int /* non-volatile */ a;
int /* non-volatile */ b;
ThreadA()
{
int tmp = a;
b = tmp;
}
ThreadB()
{
int tmp = b;
a = tmp;
}

对于上面的代码,a==b==1的结果是符合 HB 一致性的。看起来这个比例子 1 中出现的情况更费解一些,因为 1 这个值似乎是无中生有的。但是我们首先假设int tmp = a;读取到了 1 ,此时b = tmp;将会写入 1 。而int tmp = b;又读取到了该值,这会导致a = tmp;写入值 1 ,恰恰满足了int tmp = a;读取到 1 的需要。HB 一致性中,如果没有 HB 关系阻止一个值被读取,则该读取都是被允许的,也就是可以认为int tmp = a;通过数据竞争的方式读取到了未来的写入值。按照这种方式考虑,这个例子实际上类似于例子1中的第二个示例。

但是显然,这个结果是违反直觉的,其结果也被 JMM 禁止。我们使用因果性的方式进行分析。

首先,显然我们有 C0={W(a,0),W(b,0)} 。接着我们提交int tmp = a;(不能先提交b = tmp;是因为int tmp = a;与其存在依赖关系,且有 HB 关系)。根据 C0 的内容,显然此时只允许提交 R(a,0) 或 R(b,0) 。通过因果性分析,我们得到这个例子的合法输出只能是a==b==1

总结

非正式的说,可以认为通过结合 HB 一致性和因果性要求得到 JMM 。这两个约束结合在一起,才有了 JMM 对程序员的保证:如果一个程序是正确同步的,其程序表现为顺序一致性。

理解 Java 内存模型的因果性约束的更多相关文章

  1. 深入理解java内存模型

    深入理解Java内存模型(一)——基础 深入理解Java内存模型(二)——重排序 深入理解Java内存模型(三)——顺序一致性 深入理解Java内存模型(四)——volatile 深入理解Java内存 ...

  2. 深入理解Java内存模型之系列篇

    深入理解Java内存模型(一)——基础 并发编程模型的分类 在并发编程中,我们需要处理两个关键问题:线程之间如何通信及线程之间如何同步(这里的线程是指并发执行的活动实体).通信是指线程之间以何种机制来 ...

  3. 深入理解 Java 内存模型(转载)

    摘要: 原创出处 http://www.54tianzhisheng.cn/2018/02/28/Java-Memory-Model/ 「zhisheng」欢迎转载,保留摘要,谢谢! 0. 前提 &l ...

  4. 【并发编程】一文带你读懂深入理解Java内存模型(面试必备)

    并发编程这一块内容,是高级资深工程师必备知识点,25K起如果不懂并发编程,那基本到顶.但是并发编程内容庞杂,如何系统学习?本专题将会系统讲解并发编程的所有知识点,包括但不限于: 线程通信机制,深入JM ...

  5. 《深入理解 Java 内存模型》读书笔记

    ![img](https://mmbiz.qpic.cn/mmbiz_jpg/1flHOHZw6RtPu3BNx3zps1JhSmPICRw7QgeOmxOfTbCT3RLgIo4qRpn6xL4qg ...

  6. 转《深入理解 Java 内存模型》读书笔记

    转:https://mp.weixin.qq.com/s/2hA6u4hLEPWlTPdD-XB-bg 前提 <深入理解 Java 内存模型>程晓明著,该书在以前看过一遍,现在学的东西越多 ...

  7. 深入理解java内存模型系列文章

    转载关于java内存模型的系列文章,写的非常好. 深入理解java内存模型(一)--基础 深入理解java内存模型(二)--重排序 深入理解java内存模型(三)--顺序一致性 深入理解java内存模 ...

  8. 【Todo】【转载】深入理解Java内存模型

    提纲挈领地说一下Java内存模型: 什么是Java内存模型 Java内存模型定义了一种多线程访问Java内存的规范.Java内存模型要完整讲不是这里几句话能说清楚的,我简单总结一下Java内存模型的几 ...

  9. 深入理解Java内存模型(一)——基础(转)

    转自程晓明的"深入理解Java内存模型"的博客 http://www.infoq.com/cn/articles/java-memory-model-1 并发编程模型的分类 在并发 ...

随机推荐

  1. Opencv笔记(十二)——形态学转换

    学习目标: 学习不同的形态学操作,例如腐蚀,膨胀,开运算,闭运算等 我们要学习的函数有: cv2.erode(), cv2.dilate(), cv2.morphologyEx()等 原理简介: 形态 ...

  2. [ZJOI2019]麻将(DP+有限状态自动机)

    首先只需要考虑每种牌出现的张数即可,然后判断一副牌是否能胡,可以DP一下,令f[i][j][k][0/1]表示到了第i位,用j次i-1,i,i+1和k次i,i+1,i+2,是否出现对子然后最大的面子数 ...

  3. Cantor表(模拟)

    链接:https://ac.nowcoder.com/acm/contest/1069/I来源:牛客网 题目描述 现代数学的著名证明之一是Georg Cantor证明了有理数是可枚举的.他是用下面这一 ...

  4. MTSP问题

    问题描述:m个旅行商去旅游 n个城市,规定都必须从同一个出发点出发,而且返回原出发点,需要将所有的城市遍历完毕,每个城市只能游历一次,但是为了路径最短可以路过这个城市多次.这个就是多旅行商问题.是在T ...

  5. 53)PHP,类的继承

    详见   视频第十七天  中的第二节 类的继承 所以   类之间的继承就是一种新的关系的建立,并不是将父类的东西重新复制给子类--------------------- 当你实例化一个类的时候,调用它 ...

  6. 关于用struts2框架中iframe对应的jsp页面的不到action的值的问题

    我们做web项目经常会用到frameset.frame以及iframe,这大大方便了我们页面的构建以及模块功能的划分.但是,再使用这些技术的同时也会遇到各种各样的问题,其中一个就是子页面中得不到str ...

  7. ccpc20190823

    04 http://acm.hdu.edu.cn/showproblem.php?pid=6705 分析:先把每条边以 形式放进堆,堆按路径权值从小到大排序,然后每次取出堆顶,用v的出边扩展 新的路径 ...

  8. 前端之css引入方式/长度及颜色单位/常用样式

    1.css三种引入方式 <!DOCTYPE html><html><head> <meta charset="UTF-8"> < ...

  9. deeplearning.ai 序列模型 Week 1 RNN(Recurrent Neural Network)

    1. Notations 循环序列模型的输入和输出都是时间序列.$x^{(i)<t>}$表示第$i$个输入样本的第$t$个元素,$T_x^{(i)}$表示输入的第$i$个样本的元素个数:$ ...

  10. 同步linux系统时间

    Linux的时间分为System Clock(系统时间)和Real Time Clock (硬件时间,简称RTC). 系统时间:指当前Linux Kernel中的时间. 硬件时间:主板上有电池供电的时 ...