诡异并发可见性

网友投稿 515 2022-05-29

我们都知道,随着祖国越来越繁荣昌盛,随着科技的进步,设备的更新换代,计算机体系结构、操作系统、编译程序都在不断地改革创新,但始终有一点是不变的(我对华为云的热爱忠贞不渝):那就是下面三者的性能耗时:CPU < 内存 < I/O

但也正因为这些改变,也就在并发程序中出现了一些诡异的问题,而其中最昭著的三大问题就是:可见性、有序性、原子性。

而今天阿淼我就为大家介绍其中的恶霸之一可见性。

零、可见性的阐述

「可见性」 的定义是:一个线程对共享变量的修改,另外一个线程能够立刻看到。

在单核时代,所有线程都在一个CPU上执行,所以一个线程的写,一定是对其它线程可见的。就好比,一个总经理下面就一个项目负责人。

此时,项目经理查看到任务G后,分配给员工A和员工B,那么这个任务的进度就能随时掌握在项目经理手中了;每个员工都能从项目经理处得知最新的项目进度。

而在多核时代后,每个CPU都有自己的缓存,这就出现了可见性问题。

此时,两个项目经理同时查看到任务G后,各自分配给自己下属员工,那么这个任务的进度就只能掌握在各自项目经理手中了,因为所有员工的工作进度并不是汇报给同一个项目经理;那么,每个员工只能得知自己项目组员工的工作进度,并不能得知其他项目组的工作进度。所以,当多个项目经理在做同一个任务时,就可能出现任务配比不均、任务进度拖延、任务重复进行等多种问题。

总结上面的例子来讲,就是因为进度的不及时更新,导致数据不是最新,导致决策失误。所以,我们隐约可以看出,内存并不直接与Cpu打交道,而是通过高速缓存与Cpu打交道。

cpu <——> 高速缓存 <———> 内存

通过一张图片来表示就是(多核):

下文我们的阐述,若无特殊说明,都是基于多核的。

一、导致共享变量在线程之间不可见的原因:

可见性问题都是由Cpu缓存不一致为并发编程带来,而其中的主要有下面三种情况:

1.1、线程交叉执行

线程交叉执行多数情况是由于线程切换导致的,例如下图中的线程A在执行过程中切换到线程B执行完成后,再切换回线程A执行剩下的操作;此时线程B对变量的修改不能对线程A立即可见,这就导致了计算结果和理想结果不一致的情况。

1.2、重排序结合线程交叉执行

例如下面这段代码

int a = 0; //行1 int b = 0; //行2 a = b + 10; //行3 b = a + 9; //行4

如果行1和行2在编译的时候改变顺序,执行结果不会受到影响;

如果将行3和行4在变异的时候交换顺序,执行结果就会受到影响,因为b的值得不到预期的19;

由图知:由于编译时改变了执行顺序,导致结果不一致;而两个线程的交叉执行又导致线程改变后的结果也不是预期值,简直雪上加霜!

1.3、共享变量更新后的值没有在工作内存及主存间及时更新

因为主线程对共享变量的修改没有及时更新,子线程中不能立即得到最新值,导致程序不能按照预期结果执行。

例如下面这段代码:

package com.itquan.service.share.resources.controller; import java.time.LocalDateTime; /** * @author :mmzsblog * @description:共享变量在线程间的可见性测试 */ public class VisibilityDemo { // 状态标识flag private static boolean flag = true; public static void main(String[] args) throws InterruptedException { System.out.println(LocalDateTime.now() + "主线程启动计数子线程"); new CountThread().start(); Thread.sleep(1000); // 设置flag为false,使上面启动的子线程跳出while循环,结束运行 VisibilityDemo.flag = false; System.out.println(LocalDateTime.now() + "主线程将状态标识flag被置为false了"); } static class CountThread extends Thread { @Override public void run() { System.out.println(LocalDateTime.now() + "计数子线程start计数"); int i = 0; while (VisibilityDemo.flag) { i++; } System.out.println(LocalDateTime.now() + "计数子线程end计数,运行结束:i的值是" + i); } } }

运行结果是:

从控制台的打印结果可以看出,因为主线程对flag的修改,对计数子线程没有立即可见,所以导致了计数子线程久久不能跳出while循环,结束子线程。

对于这种情况,作为有强迫症的阿淼我当然不能忍,所以就引出了下一个问题:如何解决线程间不可见性

二、如何解决线程间不可见性

为了保证线程间可见性我们一般有3种选择:

2.1、volatile:只保证可见性

volatile关键字能保证可见性,但也只能保证可见性,在此处就能保证flag的修改能立即被计数子线程获取到。

此时纠正上面例子出现的问题,只需在定义全局变量的时候加上volatile关键字

// 状态标识flag private static volatile boolean flag = true;

2.2、Atomic相关类:保证可见性和原子性

将标识状态flag在定义的时候使用Atomic相关类来进行定义的话,就能很好的保证flag属性的可见性以及原子性。

此时纠正上面例子出现的问题,只需在定义全局变量的时候将变量定义成Atomic相关类

// 状态标识flag

private static AtomicBoolean flag = new AtomicBoolean(true);

不过值得注意的一点是,此时原子类相关的方法设置新值和得到值的放的是有点变化,如下:

// 设置flag的值

VisibilityDemo.flag.set(false);

// 获取flag的值

VisibilityDemo.flag.get()

2.3、Lock: 保证可见性和原子性

此处我们使用的是Java常见的synchronized关键字。

此时纠正上面例子出现的问题,只需在为计数操作i++添加synchronized关键字修饰

synchronized (this) {

i++;

}

通过上面三种方式,阿淼我都得到类似如下的期望结果:

然而,接下来阿淼我要对其中的volatile和synchronized关键字做一番较为详细的解释。

三、可见性-volatile

Java内存模型对volatile关键字定义了一些特殊的访问规则,当一个变量被volatile修饰后,它将具备两种特性,或者说volatile具有下列两层语义:

第一、保证了不同线程对这个变量进行读取时的可见性。即一个线程修改了某个变量的值, 这个新值对其他线程来说是立即可见的。 (volatile解决了线程间共享变量的可见性问题)。

第二、禁止进行指令重排序, 阻止编译器对代码的优化。

我们都知道,随着祖国越来越繁荣昌盛,随着科技的进步,设备的更新换代,计算机体系结构、操作系统、编译程序都在不断地改革创新,但始终有一点是不变的(我对华为云的热爱忠贞不渝):那就是下面三者的性能耗时:CPU < 内存 < I/O

但也正因为这些改变,也就在并发程序中出现了一些诡异的问题,而其中最昭著的三大问题就是:可见性、有序性、原子性。

而今天阿淼我就为大家介绍其中的恶霸之一可见性。

零、可见性的阐述

「可见性」 的定义是:一个线程对共享变量的修改,另外一个线程能够立刻看到。

在单核时代,所有线程都在一个CPU上执行,所以一个线程的写,一定是对其它线程可见的。就好比,一个总经理下面就一个项目负责人。

此时,项目经理查看到任务G后,分配给员工A和员工B,那么这个任务的进度就能随时掌握在项目经理手中了;每个员工都能从项目经理处得知最新的项目进度。

而在多核时代后,每个CPU都有自己的缓存,这就出现了可见性问题。

此时,两个项目经理同时查看到任务G后,各自分配给自己下属员工,那么这个任务的进度就只能掌握在各自项目经理手中了,因为所有员工的工作进度并不是汇报给同一个项目经理;那么,每个员工只能得知自己项目组员工的工作进度,并不能得知其他项目组的工作进度。所以,当多个项目经理在做同一个任务时,就可能出现任务配比不均、任务进度拖延、任务重复进行等多种问题。

总结上面的例子来讲,就是因为进度的不及时更新,导致数据不是最新,导致决策失误。所以,我们隐约可以看出,内存并不直接与Cpu打交道,而是通过高速缓存与Cpu打交道。

cpu <——> 高速缓存 <———> 内存

通过一张图片来表示就是(多核):

下文我们的阐述,若无特殊说明,都是基于多核的。

一、导致共享变量在线程之间不可见的原因:

可见性问题都是由Cpu缓存不一致为并发编程带来,而其中的主要有下面三种情况:

1.1、线程交叉执行

线程交叉执行多数情况是由于线程切换导致的,例如下图中的线程A在执行过程中切换到线程B执行完成后,再切换回线程A执行剩下的操作;此时线程B对变量的修改不能对线程A立即可见,这就导致了计算结果和理想结果不一致的情况。

1.2、重排序结合线程交叉执行

例如下面这段代码

int a = 0; //行1 int b = 0; //行2 a = b + 10; //行3 b = a + 9; //行4

如果行1和行2在编译的时候改变顺序,执行结果不会受到影响;

如果将行3和行4在变异的时候交换顺序,执行结果就会受到影响,因为b的值得不到预期的19;

由图知:由于编译时改变了执行顺序,导致结果不一致;而两个线程的交叉执行又导致线程改变后的结果也不是预期值,简直雪上加霜!

1.3、共享变量更新后的值没有在工作内存及主存间及时更新

因为主线程对共享变量的修改没有及时更新,子线程中不能立即得到最新值,导致程序不能按照预期结果执行。

例如下面这段代码:

package com.itquan.service.share.resources.controller; import java.time.LocalDateTime; /** * @author :mmzsblog * @description:共享变量在线程间的可见性测试 */ public class VisibilityDemo { // 状态标识flag private static boolean flag = true; public static void main(String[] args) throws InterruptedException { System.out.println(LocalDateTime.now() + "主线程启动计数子线程"); new CountThread().start(); Thread.sleep(1000); // 设置flag为false,使上面启动的子线程跳出while循环,结束运行 VisibilityDemo.flag = false; System.out.println(LocalDateTime.now() + "主线程将状态标识flag被置为false了"); } static class CountThread extends Thread { @Override public void run() { System.out.println(LocalDateTime.now() + "计数子线程start计数"); int i = 0; while (VisibilityDemo.flag) { i++; } System.out.println(LocalDateTime.now() + "计数子线程end计数,运行结束:i的值是" + i); } } }

运行结果是:

从控制台的打印结果可以看出,因为主线程对flag的修改,对计数子线程没有立即可见,所以导致了计数子线程久久不能跳出while循环,结束子线程。

对于这种情况,作为有强迫症的阿淼我当然不能忍,所以就引出了下一个问题:如何解决线程间不可见性

二、如何解决线程间不可见性

为了保证线程间可见性我们一般有3种选择:

2.1、volatile:只保证可见性

volatile关键字能保证可见性,但也只能保证可见性,在此处就能保证flag的修改能立即被计数子线程获取到。

此时纠正上面例子出现的问题,只需在定义全局变量的时候加上volatile关键字

// 状态标识flag private static volatile boolean flag = true;

2.2、Atomic相关类:保证可见性和原子性

将标识状态flag在定义的时候使用Atomic相关类来进行定义的话,就能很好的保证flag属性的可见性以及原子性。

此时纠正上面例子出现的问题,只需在定义全局变量的时候将变量定义成Atomic相关类

// 状态标识flag

private static AtomicBoolean flag = new AtomicBoolean(true);

不过值得注意的一点是,此时原子类相关的方法设置新值和得到值的放的是有点变化,如下:

// 设置flag的值

VisibilityDemo.flag.set(false);

// 获取flag的值

VisibilityDemo.flag.get()

2.3、Lock: 保证可见性和原子性

此处我们使用的是Java常见的synchronized关键字。

此时纠正上面例子出现的问题,只需在为计数操作i++添加synchronized关键字修饰

synchronized (this) {

i++;

}

通过上面三种方式,阿淼我都得到类似如下的期望结果:

然而,接下来阿淼我要对其中的volatile和synchronized关键字做一番较为详细的解释。

三、可见性-volatile

Java内存模型对volatile关键字定义了一些特殊的访问规则,当一个变量被volatile修饰后,它将具备两种特性,或者说volatile具有下列两层语义:

第一、保证了不同线程对这个变量进行读取时的可见性。即一个线程修改了某个变量的值, 这个新值对其他线程来说是立即可见的。 (volatile解决了线程间共享变量的可见性问题)。

第二、禁止进行指令重排序, 阻止编译器对代码的优化。

针对第一点,volatile保证了不同线程对这个变量进行读取时的可见性,具体表现为:

1: 使用 volatile 关键字会强制将在某个线程中修改的共享变量的值立即写入主内存。

2: 使用 volatile 关键字的话, 当线程 2 进行修改时, 会导致线程 1 的工作内存中变量的缓存行无效(反映到硬件层的话, 就是 CPU 的 L1或者 L2 缓存中对应的缓存行无效);

附一张CPU缓存模型图:

3: 由于线程 1 的工作内存中变量的缓存行无效,所以线程1再次读取变量的值时会去主存读取。基于这一点,所以我们经常会看到文章中或者书本中会说volatile 能够保证可见性。

「综上所述」:就是用volatile修饰的变量,对这个变量的读写,不能使用 CPU 缓存,必须从内存中读取或者写入。

使用volatile无法保障线程安全,那么volatile的作用是什么呢?

其中之一:(对状态量进行标记,保证其它线程看到的状态量是最新值)

volatile关键字是Java虚拟机提供的最轻量级的同步机制,很多人由于对它理解不够(其实这里你想理解透的话可以看看happens-before原则),而往往更愿意使用synchronized来做同步。所以接下来阿淼我再说说synchronized关键字。

四、可见性synchronized

4.1、作用域

synchronized关键字的作用域有二种:

1)是某个对象实例内,synchronized aMethod(){}可以防止多个线程同时访问这个对象的synchronized方法。

如果一个对象有多个synchronized方法,只要一个线程访问了其中的一个synchronized方法,其它线程不能同时访问这个对象中任何一个synchronized方法。

这时,不同的对象实例的synchronized方法是不相干扰的。也就是说,其它线程照样可以同时访问相同类的另一个对象实例中的synchronized方法。

因为当修饰非静态方法的时候,锁定的是当前实例对象。

1)是某个对象实例内,synchronized aMethod(){}可以防止多个线程同时访问这个对象的synchronized方法。

如果一个对象有多个synchronized方法,只要一个线程访问了其中的一个synchronized方法,其它线程不能同时访问这个对象中任何一个synchronized方法。

这时,不同的对象实例的synchronized方法是不相干扰的。也就是说,其它线程照样可以同时访问相同类的另一个对象实例中的synchronized方法。

因为当修饰非静态方法的时候,锁定的是当前实例对象。

2)是某个类的范围,synchronized static aStaticMethod{}防止多个线程同时访问这个类中的synchronized static 方法。它可以对类的所有对象实例起作用。

因为当修饰静态方法的时候,锁定的是当前类的 Class 对象。

2)是某个类的范围,synchronized static aStaticMethod{}防止多个线程同时访问这个类中的synchronized static 方法。它可以对类的所有对象实例起作用。

因为当修饰静态方法的时候,锁定的是当前类的 Class 对象。

4.2、可用于方法中的某个区块中

除了方法前用synchronized关键字,synchronized关键字还可以用于方法中的某个区块中,表示只对这个区块的资源实行互斥访问。

用法是:

synchronized(this){

/*区块*/

}

它的作用域是当前对象;

4.3、不能继承

synchronized关键字是不能继承的,也就是说,基类的方法

synchronized f(){

// 具体操作

}

在继承类中并不自动是

synchronized f(){

// 具体操作

}

而是变成了

f(){

// 具体操作

}

继承类需要你显式的指定它的某个方法为synchronized方法;

综上3点所述:synchronized关键字主要有以下这3种用法:

「修饰实例方法」:作用于当前实例加锁,进入同步代码前要获得当前实例的锁

「修饰静态方法」:作用于当前类对象加锁,进入同步代码前要获得当前类对象的锁

「修饰代码块」:指定加锁对象,对给定对象加锁,进入同步代码块前要获得给定对象的锁

这三种用法就基本保证了共享变量在读取的时候,读取到的是最新的值。

4.4、JVM关于synchronized的两条规定:

线程解锁前,必须把共享变量的最新值刷新到主内存

线程解锁前,必须把共享变量的最新值刷新到主内存

线程加锁时,将清空工作内存中共享变量的值,从而是使用共享变量时,需要从主内存中重新读取最新的值(注意:加锁与解锁是同一把锁)

线程加锁时,将清空工作内存中共享变量的值,从而是使用共享变量时,需要从主内存中重新读取最新的值(注意:加锁与解锁是同一把锁)

从上面的这两条规则也可以看出,这种方式保证了内存中的共享变量一定是最新值。

但我们在使用synchronized保证可见性的时候也要注意以下几点:

A.无论synchronized关键字加在方法上还是对象上,它取得的锁都是对象;而不是把一段代码或函数当作锁――而且同步方法很可能还会被其他线程的对象访问。

B.每个对象只有一个锁(lock)与之相关联。Java 编译器会在 synchronized 修饰的方法或代码块前后自动加上加锁 lock() 和解锁 unlock(),这样做的好处就是加锁 lock() 和解锁 unlock() 一定是成对出现的,毕竟忘记解锁 unlock() 可是个致命的 Bug(意味着其他线程只能死等下去了)。

C.实现同步是要很大的系统开销作为代价的,甚至可能造成死锁,所以尽量避免无谓的同步控制。

以上内容就是我对并法中的可见性的一点理解与总结了,下期我们接着叙述并发中的有序性。

参考文章:

1、极客时间的Java并发编程实战

2、https://www.jianshu.com/p/89a8fa8ffe39

3、https://www.cnblogs.com/xiaonantianmen/p/9970368.html

4、https://www.lagou.com/lgeduarticle/78722.html

5、https://blog.csdn.net/evankaka/article/details/44153709

6、https://juejin.im/post/5d52abd1e51d4561e6237124

诡异的并发之可见性

Java 多线程

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Python 多线程 VS 多进程(一)
下一篇:面试官:MySQL 有哪些锁??
相关文章