查看原文
其他

Java内存模型之可见性(填坑之路)

ImportNew 2022-09-23

(给ImportNew加星标,提高Java技能)

转自:简书   作者:徐志毅

www.jianshu.com/p/6abcddd04f4e

前几天路过一个经常负责面试的同事附近,看到几个人在讨论volatile的可见性问题,当时第一感觉是 :“可见性还不简单吗?volatile修饰一个变量时,那么在一个线程都对这个变量的更改,其他线程都立即可见。”

后面听到这样一句话:“实际运行结果能刷新你的三观,网上的例子很多都是有问题的”,让我瞬间产生了兴趣。凑近一看,果然跟我的很多认知都产生了偏差。

为了解决其中的疑惑,查阅的不少文章,拨开了一些迷雾,现将结果整理出来,与大家一同探讨。

基础Java环境:

java version "1.8.0_172" Java(TM) SE Runtime Environment (build 1.8.0_172-b11) Java HotSpot(TM) 64-Bit Server VM (build 25.172-b11, mixed mode)

基本概念


Java内存模型


首先先复习一下内存模型的概念:

Java内存模型(即Java Memory Model,简称JMM)本身是一种抽象的概念,并不真实存在,它描述的是一组规则或规范,通过这组规范 定义了程序中各个变量(包括实例字段,静态字段和构成数组对象的元素)的访问方式。

JVM程序运行的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),用于存储线程私有的数据,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝的自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,工作内存中存储着主内存中的变量副本拷贝,前面说过,工作内存是每个线程的私有数据区域,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图:


volatile关键字


volatile是老生常谈的一个关键字,大家在编程中其实用得都很少,面试中比较常见,也正是这个原因,让大家对这一块的理解与实际结果产生了偏差。

volatile是Java虚拟机提供的轻量级的同步机制。volatile关键字有如下两个作用。

1)保证被volatile修饰的共享变量对所有线程 总是可见的,也就是当一个线程修改了一个被volatile修饰共享变量的值,新值总是可以被其他线程立即得知。

2)禁止指令重排序优化。

可见性


关于内存模型和volatile的概念本篇不做详细赘述,不熟悉的看官建议先百度一下。JMM是围绕 原子性、有序性、可见性 展开的,本文主要围绕内存模型的可见性出发,通过实际例子来探究其运行原理。

先思考一个问题:volatile保证的“立即可见”的反义是什么?

这是大家最容易想到的答案,应该是“不可见”,且有实实在在的例子让我们觉得“不可见”深根不移。

示例1:
package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test1 {

private static boolean flag = true;

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (flag) {
i++;
}
System.out.printf("**********test1 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(100);
flag = false;
System.out.printf("**********test1 main thread 结束, i=%d **********\n", i);
}
}


示例2:

package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test2 {

private static volatile boolean flag = true;

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (flag) {
i++;
}
System.out.printf("**********test2 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(100);
flag = false;
System.out.printf("**********test2 main thread 结束, i=%d **********\n", i);
}
}


示例1和示例2的唯一区别在于,示例2的flag有volatile修饰。上述示例的运行结果大家都“知道”,示例1会一直死循环,示例2会立即跳出循环。大家可能都运行过这两段(或者相似的)代码,大部分人对结果很满意,因为符合预期,没有加volatile关键字的成员变量多线程之间不可见。

回到刚刚那个问题,“立即可见”的反义是什么?

通过上述实践我们可以“肯定”的回答:“立即可见”的反义是“不可见”!!!而且是“一直不可见”

说到这里,可能有部分人有疑问了,“立即可见”的反义应该是“不立即可见”,说人话就是“可能过一段时间后可见,不一定是马上可见”。可是即使我们运行一万遍示例1的代码,
都是一直不可见。怎么办?继续往下看。

实战


让没有volatile也能跳出循环


方式一


示例3:
package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test3 {

private static boolean flag = true;

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (flag) {
i++;
}
System.out.printf("**********test3 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(1);
flag = false;
System.out.printf("**********test3 main thread 结束, i=%d **********\n", i);
}
}


在示例3中,我仅将示例1中的sleep时间改为1毫秒,while循环即可成功跳出,输出结果如下:
**********test3 main thread 结束, i=60167 **********
**********test3 跳出成功, i=60167 **********

ps:主线程可能由于停顿时间太短,导致while循环根本没进去。重试几次,当i的值不为0即代表已经进入循环。

对比示例1和示例3我们可以得出一个结论:

  • 当主线程停顿时间很极短(1~2ms)时,可以跳出循环;
  • 当主线程停顿时间较长时,无法跳出循环;

结论变种1:

  • 当子线程循环执行时间极短(1~2ms)时,可以跳出循环;
  • 当子线程循环执行时间较长时,无法跳出循环;

结论变种2:

  • 当子线程循环次数较少时,可以跳出循环;
  • 当子线程循环次数较多时,无法跳出循环;

看上去是不是有点意思?代码的执行结果居然跟执行时间、循环次数有关?推断到这里,有些看官可能已经想到了JIT即使编译优化。没错,正是JIT的优化对运行结果产生了影响。

关于JIT

当虚拟机发现某个方法或代码块运行特别频繁时,就会把这些代码认定为“Hot Spot Code”(热点代码),为了提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成与本地平台相关的机器码,并进行各层次的优化,完成这项任务的正是 JIT 编译器。

运行过程中会被即时编译器编译的“热点代码”有两类:

1)被多次调用的方法。
2)被多次调用的循环体。

如何验证上述结论呢?

  • -Xint :强制使用解释执行的方式启动java虚拟机,此模式下,不会使用JIT优化,示例1和示例3的代码都会跳出循环。
  • -Xcomp:强制使用编译执行的方式启动java虚拟机,此模式下,代码会被优化并编译成机器码,示例1和示例3都无法填出循环。

总结一下:mac下默认为-Xmixed混合模式,使用java -version可以查看,混合模式下只有热点代码达到一定阈值才会发生JIT优化,因此导致了上述看到的运行时间长短对运行结果的影响。

方式二


不少热心的网友在自己运行示例1代码的时候,会不由自主的加上一行print,如下:

示例4:
package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test4 {

private static boolean flag = true;

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (flag) {
i++;
System.out.println("i=" + i);
}
System.out.printf("**********test4 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(100);
flag = false;
System.out.printf("**********test4 main thread 结束, i=%d **********\n", i);
}
}


上述代码一运行后成功跳出,可能又惊倒了一批看官,为什么多一行print结果又不一样了。而且就算在-Xcomp模式优化后也可以跳出。有点神奇吧?

为了找出原因,我对print代码进行了几次不同的替换:

示例5:
package com.youzan;

import java.util.HashMap;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test5 {

private static boolean flag = true;

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (flag) {
doSomeThing1();
}
System.out.printf("**********test4 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(10);
flag = false;
System.out.printf("**********test4 main thread 结束, i=%d **********\n", i);
}

private static void doSomeThing1() {
System.out.println("doSomeThing1");
}

private static void doSomeThing2() {
synchronized (Test5.class) {
i++;
}
}

private static void doSomeThing3() {
i++;
Thread.yield();
}

private static void doSomeThing4() {
new HashMap<>();
}
}


上述代码中,不论是在循环体内执行哪一个方法(doSomeThing1~ doSomeThing4),都可以正常跳出循环。为什么呢?究竟是什么影响了线程对成员变量的可见性呢?我的结论如下:

根据java的内存模型规范,一个线程对普通变量的修改并不需要立即写回到主存,且另一个线程读取也不需要每一次都从主存中去读取。至于什么时候与主内存同步,虚拟机只需保证方法出栈时将修改的值同步到主内存。因此这其中有比较宽松的优化空间。而上述几个方法,都存在一定的同步空间。虚拟机会在此时与主内存同步。

ps:以上结论纯属猜测,没有很好的论据,欢迎大家探讨!

volatile的传播范围


思考两个问题:

  1. 把volatile对象传递给另一个对象,新对象是否立即可见呢?


  2. 当volatile修饰对象时,如果对象的嵌套的层级较深,那该对象的内部是否立即可见呢?

示例6:
package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test6 {

private static volatile ReferenceFlag referenceFlag = new ReferenceFlag();

private static int i = 0;

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
BaseFlag baseFlag = referenceFlag.baseFlag;
while (baseFlag.flag) {
i++;
}
System.out.printf("**********test6 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(100);
referenceFlag.baseFlag.flag = false;
System.out.printf("**********test6 main thread 结束, i=%d **********\n", i);
}

static class BaseFlag {
boolean flag = true;
}

static class ReferenceFlag {
volatile BaseFlag baseFlag = new BaseFlag();
}
}


在示例6中,使用了引用嵌套的方式来验证volatile是否可以传递给一个局部变量,示例中的引用都是用来volatile关键字来修饰,运行结果是无法跳出。


结论一:当使用一个变量来接受一个volatile修饰的变量时,volatile的可见性并不会传递。即新的变量不再具有volatile特性。


示例2:
package com.youzan;

/**
* Date: 2018/8/12
* @author xuzhiyi
*/

public class Test7 {

private static int i = 0;

private static volatile DeapReferenceInnerFlag deapReferenceInnerFlag = new DeapReferenceInnerFlag();

public static void main(String[] args) throws InterruptedException {
Thread thread = new Thread(() -> {
while (deapReferenceInnerFlag.referenceInnerFlag.baseFlag.flag) {
i++;
}
System.out.printf("**********test7 跳出成功, i=%d **********\n", i);
});
thread.start();
Thread.sleep(100);
deapReferenceInnerFlag.referenceInnerFlag.baseFlag.flag = false;
System.out.printf("**********test7 main thread 结束, i=%d **********\n", i);
}

static class BaseFlag {
boolean flag = true;
}

static class ReferenceInnerFlag {
BaseFlag baseFlag = new BaseFlag();
}

static class DeapReferenceInnerFlag {
ReferenceInnerFlag referenceInnerFlag = new ReferenceInnerFlag();
}
}

示例7是一个多层嵌套的对象,只有最外层使用volatile修饰,当其内部的值改变后,使用链式调用的方式,则一直可以取到最新的值。

结论二:对于多层嵌套的对象,最外层使用volatile修饰,使用链式调用的方式,volatile的可见性可以传播。

ps:结论二没有很好的理论依据,仅从实践上看是如此。

总结


本篇结合实际的几个例子,讲述了几个认识误区。仅通过运行结果说明了一些问题,但依然不够深入,不足之处,还望指出。


推荐阅读  点击标题可跳转

基础原理系列:服务端 TCP 连接的 TIME_WAIT 问题

【讨论】:缓存同步、如何保证缓存一致性、缓存误用

JAVA 泛型中的通配符 T,E,K,V,?


看完本文有收获?请转发分享给更多人

关注「ImportNew」,提升Java技能

好文章,我在看❤️

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存