查看原文
其他

并发编程中的大坑:你的直觉&有序性问题

The following article is from 京东技术 Author 京东物流-王宝令

 引言


 

并发编程无疑是编程领域中的上甘岭,他的“难”主要体现在两个方面,从宏观上来讲,主要是如何确定最优化的模型,例如Redis是单线程模型,Nginx是多进程单线程模型,而Netty是主从Reactor多线程模型;从微观上来讲,主要是原子性、可见性、有序性等问题的纠缠,这些问题有一个共同点,就是直觉失效。我们大部分情况下都是靠直觉来写程序的,如果直觉失效,会意味着什么呢?意味着直觉在引导我们写bug,引导我们误入歧途。今天我们就重点来聊聊直觉失效的问题之一:有序性问题。相信你看完这篇文章,肯定会大吃一惊:“原来一不小心写了这么多bug!”好在解决方案还是很简单的,只要了解了原理就可能轻松搞定。


01


一个简单的并发程序




在下面的代码中,线程T1执行一个计算任务(简化为data=666),任务完成后通过isReady标识结束了,线程T2等待线程T1完成计算任务(while (!isReady) {}),当线程T2观察到isReady为true时,执行后续任务(简化为r = data + 222),那线程T2能得到预期的结果r==888吗?

 

int data=0; bool isReady=false;

data=666;

isReady=true;

while(!isReady){};

int r = data+222;

 

直觉告诉我们能看到预期的结果888,我们的直觉源自缜密的逻辑推导:线程T1中,首先对data进行了赋值操作,后对isReady进行了赋值操作,所以线程T2中观察到 isReady==true 时,data一定等于666,然后就会得到 r==888。

 

仅有理论推导还不够,最好跑个程序测试一下,理论联系实践,双保险。于是我们又写了下面这个验证程序,执行数次,并没有发现打印出异常数据。于是我们终于可以得出结论:一切OK!

boolean isReady=false;int data = 0;int r;public void main(String[] args) throws InterruptedException { for (int i=0; i<10000; i++) { Thread t1=new Thread(()->{ data = 666; isReady = true; }); Thread t2=new Thread(()->{ while (!isReady) {}; r = data + 222; }); t2.start(); t1.start(); t2.join(); if (r != 888) { System.out.println(r); } }}


 当然了,这一起都是假象,理论推导,其过程没有错,但是假设条件有问题;实践代码也没有问题,但是不够全面。我们先从实践代码开始剖析。


02

用jcstress测试并发程




Java程序是依赖JVM解释执行,内部还有复杂的JIT优化,这些优化和JVM参数、 版本、以及CPU架构都有关系,和热点代码也有关系,JIT优化对并发测试的影响往往是颠覆式的;另外并发问题往往需要真实竞争,真实竞争指的是多个线程同一时刻在访问共享变量。上面我们的写的测试程序,并不能很好的解决JIT优化、真实竞争的问题。


好在现在已经有了不少并发测试的工具,jcstress是OpenJDK团队开源的并发测试工具,下面我们用jcstress来重写一下上面的测试程序。
@JCStressTest@Outcome(id = "888", expect=Expect.ACCEPTABLE, desc="符合预期.")@Outcome(id = "0", expect=Expect.ACCEPTABLE, desc="符合预期.")@Outcome( expect=Expect.ACCEPTABLE_INTERESTING, desc="异常结果.")@Statepublic class IsReadyTest { int data = 0; boolean isReady = false; @Actor void actor1() { data = 666; isReady = true; } @Actor void actor2(I_Result r) { if (!isReady) { r.r1 = 0; } else { r.r1 = data + 222; } }}

上面的测试程序,每个用 @Actor 注解的方法都会在一个独立的线程中执行,如果需要获得线程执行后的结果,可以将结果回写到 I_Result 中, @Outcome 注解用来验证 I_Result 中的结果是否符合预期。

在actor2()中,我们没有使用while()循环来检查isReady,而是用了if()语句,其验证效果都是一样,如果actor1()没有准备好计算结果,r.r1设置为0;反之,如果actor1()准备好了计算结果,则设置r.r1=data+222,此时r.r1的预期结果是888,所以888和0都符合我们的预期,而其他值则属于异常。

在Java11版本的JVM上执行上面的测试程序,最终的结果如下图所示。

我们发现有一个异常结果是222,出现222的唯一可能就是 isReady==true 并且 data==0,这怎么可能呢?这不就意味以下代码中的惊天大谎吗?
data = 666;isReady = true;
if (isReady) { //测试结果说明此处data等于0!!!}

 actor1()中,首先设置的data=666,然后才设置的isReady=true,直觉以及多年程序员的经验都告诉我们:后续代码如果能读到isReady==true,那么一定能读到data==666。

03

指令重排导致直觉失效

我们的直觉以及多年程序员的经验,在单线程场景中是正确的,在多线程场景中是不适用的。出于性能的考虑,Java编译器(含JIT)、CPU并没有忠实地按照我们代码的书写顺序执行代码,而是自以为是改变了执行顺序,我们一般把编译器、CPU的这种行为称为指令重排。

例如 我们书写的顺序是:
data=666; isReady=true;
而真实的执行顺序可能是:
isReady=true; data=666;

调整顺序后,在单线程上执行没有任何后遗症,例如单线程执行:
isReady = true;data = 666;
if (isReady) { //单线程中此处data仍然等于666!!!}

但是在多线程场景中,就不一定了,例如当actor1()在执行完 isReady=true 后(尚没有执行data=666),actor2()执行以下代码:
if (isReady) { r.r1 = data + 222;}

由于此时data==0,所以就会得到r.r1 == 222。

04

更匪夷所思的编译器优化



前面我们基于jcstress的测试程序没有使用while()循环来检查isReady,而是用了if()语句,为什么要做这种替换呢?直接用while()循环来验证并发问题不是更直接吗?于是我们得到如下的测试程序:
@JCStressTest@Outcome(id = "888", expect=Expect.ACCEPTABLE, desc="符合预期.")@Outcome( expect=Expect.ACCEPTABLE_INTERESTING, desc="异常结果.")@Statepublic class IsReadyTestError { int data = 0; boolean isReady = false; @Actor void actor1() { data = 666; isReady = true; } @Actor void actor2(I_Result r){ while (!isReady) {}; r.r1 = data + 222; }}

你可以放心地执行上面的测试程序,放心吧无毒,但是在执行上面这个测试程序的时候,你将渐渐听到轰鸣的风扇的声音,然后一直轰鸣下去,我想你应该猜到发生什么了,死循环发生了。上面的代码在 while (!isReady) {}; 上死循环,再没机会跳出了。

怎么会这样?actor1()可能会慢于actor2()的执行,但也定也慢不过1秒,那为什么会发生死循环呢?这其实也是编译优化惹的祸。我们直觉总是以为每次while()循环都会重新在内存中读取isReady这个变量,但是实际上,编译优化后的代码,仅仅在第一次循环时读了一次,之后所有的循环都没重新再去内存中读取isReady这个变量,从而导致while()循环死在此处,再也无法跳出。

05

利用volatile解决有序性问题



上面提到的问题我们该如何解决呢?方案很简单,只要将isReady声明为volatile变量就可以了。
int data=0;
volatile bool isReady=false;
data=666;
isReady=true;
while(!isReady){};
int r=data+222;
 
对于volatile变量,JVM会禁用指令重排,例如代码的书写顺序是这样:
data=666; isReady=true;
由于isReady是volatile变量,所以JVM会禁止 data=666 重排到 isReady=true 的后面。
 
同样的道理,以下面顺序书写的代码:
var1=isReady; var2=data;
由于isReady是volatile变量,JVM会禁止 var2=data 重排到var1=isReady的前面。
 
同时volatile变量还会禁用CPU缓存,不会因为CPU缓存导致可见性问题。
 

06

总结


在Java领域,编写线程安全的并发程序并不容易,首先我们需要解决的就是直觉失效的问题。有人把我们的认知分为四个境界:知道自己知道,知道自己不知道,不知道自己知道,不知道自己不知道,而最大悲剧在于不知道自己不知道,却以为自己知道,直觉失效就是属于此类,它会引导我们误入歧途。好在这些直觉失效的问题以及解决方案都有迹可循,极客时间我的专栏《Java并发编程实战》相对全面地解释了这些问题以及方案,如果你感兴趣,可以参考一下。


参考阅读:



本文由高可用架构翻译。技术原创及架构实践文章,欢迎通过公众号菜单「联系我们」进行投稿。


高可用架构
改变互联网的构建方式

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存