浅谈Java并发中的内存模型

2025-02-03 05:11:32

什么是JavaMemoryModel(JMM)?

JMM通过构建一个统一的内存模型来屏蔽掉不同硬件平台和不同操作系统之间的差异，让Java开发者无需关注不同平台之间的差异，达到一次编译，随处运行的目的，这也正是Java的设计目的之一。

CPU和内存

在讲JMM之前，我想先和大家聊聊硬件层面的东西。大家应该都知道执行运算操作的CPU本身是不具备存储能力的，它只负责根据指令对传递进来的数据做相应的运算，而数据存储这一任务则交给内存去完成。虽然内存的运行速度虽然比起硬盘快非常多，但是和3GHZ，4GHZ,甚至5GHZ的CPU比起来还是太慢了，在CPU的眼中，内存运行的速度简直就是弟弟中的弟弟，等内存进行一次读写操作，CPU能思考成百上千次人生了:grin:。但是CPU的运算能力是紧缺资源啊，可不能这么白白浪费了，所以得想办法解决这一个问题。

没有什么问题是一个缓存不能解决的，如果有，那就再加一个缓存 ——鲁迅：反正我没说这句话

所以人们就想到了给CPU增加一个高速缓存（为什么是加高速缓存而不是给内存提高速度就牵扯到硬件成本问题了）来解决这个问题，比如像博主用的Intel的I9 9900k CPU就带了高达16M的三级缓存，所以硬件上的内存模型大概如下图所示。

如图可以很清楚的看到，在CPU内部构建了一到多层的缓存，并且其中的L1 Cache是CPU内核心独有的，不同的Core之间是不能共享的，而L2 Cache则是所有的核心共享。简单来说就是CPU在读取一个数据时会先去最近的Cache层级上读取，如果找不到则会去下一个层级寻找，都找不到的话就会从内存中去加载，而如果Cache中能拿到所需要的数据就不会去内存读取。在将数据写回的时候也会先写入Cache中，等待合适的时机再写入到内存中（其中有一个细节就是缓存行的问题，关于这部分内容放在文章结尾）。而由于存在多个cache层级，并且部分cache还不能够被共享，所以会存在内存可见性的问题。

举个简单的例子：假设现在存在两个Core，分别是CoreA和CoreB并且他们都拥有属于自己的L1Chace和共用的L2Cache。同时有一个变量X的值为1，该变量已经被加载在L2Cahce上。此时CoreA执行运算需要用到变量X，先去L1Cache寻找，未命中，继续在L2Cache寻找，命中成功，将X=1载入L1Cahce，再经过一系列运算后将X修改为2并写入L1Cache。于此同时CoreB刚好也需要X来进行运算，此时他去自己的L1Cahce寻找，未命中，继续L2Cache寻找，命中成功，将X=1载入自己的L1Cache。此时就出现了问题，CoreA明明已经将X的值修改为2了，CoreB读取到的依然是X=1，这就是内存可见性问题。

看到这里的小伙伴们可能要问了，博主你啥情况啊，你这写的渐渐忘记标题了啊，说好了Java内存模型，你扯这么多硬件上的问题干啥啊？(╯‵□′)╯︵┻━┻

Java中的主内存和工作内存

小伙伴们别着急，其实JMM和上面的硬件层次上的模型很像，不信看下面的图片

怎么样，是不是看起来很像，可以简单的理解为线程的工作内存就是CPU里Core独占的L1Cahce，而主内存就是共享的L2Cache。所以上述的内存一致性问题也会在JMM中存在，而JMM就需要制定一些列的规则来保证内存一致性，这也是Java多线程并发的一个疑难点，那么JMM制定了哪些规则呢？

##内存间交互操作首先是主内存的工作内存之间的交互协议，具体来说定义了以下几个操作（并且保证这几个操作都是原子性的）：

lock （锁定）作用于主内存的变量，将一个变量标识为一个线程独占状态
unlock（解锁）作用于主内存的变量，将一个处于锁定状态的变量释放出来，释放之后才能被其他线程锁定
read（读取）作用于主内存的变量，将一个变量的值从主内存传输到线程工作内存中，便于之后的load操作使用
load（载入）作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
use（使用）作用于工作内存的变量，把工作内存中的一个变量值传递给执行引擎，每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
assign（赋值）作用于工作内存的变量，它把一个从执行引擎接收到的值赋值给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store（存储）作用于工作内存的变量，把工作内存中的一个变量的值传送到主内存中，以便随后的write的操作。
write（写入）作用于主内存的变量，它把store操作从工作内存中一个变量的值传送到主内存的变量中。

同时还规定了执行上述八个操作时必须遵循以下规则：

如果要把一个变量从主内存中复制到工作内存，就需要按顺寻地执行read和load操作，如果把变量从工作内存中同步回主内存中，就要按顺序地执行store和write操作。但Java内存模型只要求上述操作必须按顺序执行，而没有保证必须是连续执行。
不允许read和load、store和write操作之一单独出现
不允许一个线程丢弃它的最近assign的操作，即变量在工作内存中改变了之后必须同步到主内存中。
不允许一个线程无原因地（没有发生过任何assign操作）把数据从工作内存同步回主内存中。
一个新的变量只能在主内存中诞生，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量。即就是对一个变量实施use和store操作之前，必须先执行过了assign和load操作。
一个变量在同一时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。lock和unlock必须成对出现
如果对一个变量执行lock操作，将会清空工作内存中此变量的值，在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
如果一个变量事先没有被lock操作锁定，则不允许对它执行unlock操作；也不允许去unlock一个被其他线程锁定的变量。
对一个变量执行unlock操作之前，必须先把此变量同步到主内存中（执行store和write操作）。

上述部分参考并引用《深入理解Java虚拟机》中的内容）

volatile（能够保证内存可见性和禁止指令重排序）

对于volatile修饰的变量，JMM对其有一些特殊的规定。

内存可见性

往简单来说volatile关键字可以理解为，有一个volatile修饰的变量x，当一个线程需要使用该变量的时候，直接从主内存中读取，而当一个线程修改该变量的值时，直接写入到主内存中。根据之前的分析我们能得出具备这些特性的volatile能够保证一个变量的内存可见性和内存一致性。

指令重排序

指令重排序是一个大部分CPU都有的操作，同时JVM在运行时也会存在指令重排序的操作。简单举个:chestnut:

 private void test(){
  int a,b,c;//1
  a=1;//2
  b=3;//3
  c=a+b;//4
 }

假设有上面这么一个方法，内部有这4行代码。那么JVM可能会对其进行指令重排序，而指令重排序的规定则是as-if-serial 不管怎么重排序（编译器和处理器为了提高并行度），（单线程）程序的执行结果不能被改变。根据这一规定，编译器和处理器不会对有依赖关系的指令重排序，但是对没有依赖的指令则可能会进行重排序。放在上面的例子里面就是，第1行代码和2，3，4行代码是有依赖关系的，所以第一行代码的指令必须排在2，3，4之前，因为不可能对一个未定义的变量进行赋值操作。而第2，3行代码之间并没有相互依赖关系，所以此处可能会发生指令重排序，先执行3，再执行2。而最后的第4行代码和之前的3行代码都有依赖关系，所以他一定会放在最后执行。

既然JVM特别指出指令重排序只在单线程下和未排序的效果一致，那是否表示在多线程下会存在一些问题呢？答案是肯定的，多线程下指令重排序会带来一些意想不到的结果。

 int a=0;
 //flag作为一个标识符，标识是否写入完成
 boolean flag = false;
 public void writer(){
  a=10;//1
  flag=true;//2
 }
 public void reader(){
  if (flag)
   System.out.println("a:"+a);
 }

假设存在一个类，他有上述部分的field和method，该类在设计上以flag作为写入是否完成的标志，在单线程下这并不会存在问题。而此时有两个线程分别执行writer和reader方法，暂时不考虑内存可见性的问题，假设对a和flag的写入，是立即被其他线程所知晓的，这个时候大家觉得输出a的值为多少？10？

即使不考虑内存可见性，此时a的值还是有可能会输出0，这就是指令重排序带来的问题。在上述代码中注释1和2处的代码是没有依赖关系的，在单线程下先执行1还是2都没有任何问题，根据as-if-serial 原则此时就可能会发生指令重排序。

而volatile关键字可以禁止指令重排序。

long，double的问题

我们都知道JMM定义的8个主内存和工作内存之间的操作都是具备原子性的，但是对long和double这两个64位的数据类型有一些例外。

允许虚拟机将没有被volatile修饰的long和double的64数据的读写操作划分为两次32位的读写操作，即不要求虚拟机保证对他们的load ,store,read,write四个操作的原子性。但是大部分的虚拟机实现都保证了这四个操作的原子性的，所以大部分时候我们都不需要刻意的对long，double对象使用volatile修饰。

性能问题

volatile是Java提供的保证内存可见性的最轻量级操作，比起重量级的synchronized能快上不少，但是具体能快多少这部分没办法量化。而我们可以知道的是volatile修饰的变量读操作的性能消耗几乎和普通变量相差无几，而写操作则会慢上一些。所以当volatile能解决我们的问题的时候（内存可见性和禁止指令重排序），我们应该优先选择使用volatile而不是锁。

synchronized的内存语义

简单概括就是

当程序进入synchronized块时，把在synchronized块中用到的变量从工作内存中清楚，这样在需要访问这些变量的时候会重新从主内存中获取。当程序退出synchronized块时，把对块中恭喜变量的修改刷新到主内存。如此依赖synchronized也能保证了内存的可见性。

final的内存语义

final也能保证内存的可见性

被final修饰的字段在构造器中一旦初始化完成，并且构造器没有把this引用传递出去，那么其他线程中就能看见final字段的值。

后记之CPU缓存行和伪共享

什么是伪共享

根据前面的文章，我们知道CPU和Memory之间是有Cache的，而Cache内部是按行存储的，行拥有固定的大小，这些行被称为缓存行。当CPU访问的某个变量不在Cache中时，就会去内存里获取，并将该变量所在内存的一个缓存行大小的数据读入Cache中。由于一次读取并不是单个对象而是一整个缓存行，所以可能会存在多个变量被读入一个缓存行中。而一个缓存行只能同时被一个线程操作，所以当多个线程同时修改一个缓存行里的多个变量时会造成其他线程等待从而带来性能损耗（但是在单线程情况下，伪共享反而会提升性能，因为一次性可能会缓存多个变量，节省后续变量的读取时间）。

如何避免伪共享

在Java8之后可以使用JDK提供的@sun.misc.Contended注解来解决伪共享，像Thread中的threadLocalRandom 字段就使用了这个注解。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

在Java内存模型中测试并发程序代码

让我们来看看这段代码: import java.util.BitSet; import java.util.concurrent.CountDownLatch; public class AnExample { public static void main(String[] args) throws Exception { BitSet bs = new BitSet(); CountDownLatch latch = new CountDownLatch(1); Thread t1 = ne
Java 高并发三：Java内存模型和线程安全详解

网上很多资料在描述Java内存模型的时候,都会介绍有一个主存,然后每个工作线程有自己的工作内存.数据在主存中会有一份,在工作内存中也有一份.工作内存和主存之间会有各种原子操作去进行同步. 下图来源于这篇Blog 但是由于Java版本的不断演变,内存模型也进行了改变.本文只讲述Java内存模型的一些特性,无论是新的内存模型还是旧的内存模型,在明白了这些特性以后,看起来也会更加清晰. 1. 原子性原子性是指一个操作是不可中断的.即使是在多个线程一起执行的时候,一个操作一旦开始,就不会被其它线程干扰
浅谈Java并发中的内存模型

什么是JavaMemoryModel(JMM)? JMM通过构建一个统一的内存模型来屏蔽掉不同硬件平台和不同操作系统之间的差异,让Java开发者无需关注不同平台之间的差异,达到一次编译,随处运行的目的,这也正是Java的设计目的之一. CPU和内存在讲JMM之前,我想先和大家聊聊硬件层面的东西.大家应该都知道执行运算操作的CPU本身是不具备存储能力的,它只负责根据指令对传递进来的数据做相应的运算,而数据存储这一任务则交给内存去完成.虽然内存的运行速度虽然比起硬盘快非常多,但是和3GHZ,4GH
浅谈Java并发中ReentrantLock锁应该怎么用

目录 1.重入锁说明 2.中断响应说明 3.锁申请等待限时 tryLock(long, TimeUnit) tryLock() 4.公平锁说明源码(JDK8) 重入锁可以替代关键字 synchronized . 在 JDK5.0 的早期版本中,重入锁的性能远远优于关键字 synchronized , 但从 JDK6.0 开始, JDK 在关键字 synchronized 上做了大量的优化,使得两者的性能差距并不大. 重入锁使用 ReentrantLock 实现 1.重入锁 package
浅谈Java编程中的内存泄露情况

必须先要了解的 1.c/c++是程序员自己管理内存,Java内存是由GC自动回收的. 我虽然不是很熟悉C++,不过这个应该没有犯常识性错误吧. 2.什么是内存泄露? 内存泄露是指系统中存在无法回收的内存,有时候会造成内存不足或系统崩溃. 在C/C++中分配了内存不释放的情况就是内存泄露. 3.Java存在内存泄露我们必须先承认这个,才可以接着讨论.虽然Java存在内存泄露,但是基本上不用很关心它,特别是那些对代码本身就不讲究的就更不要去关心这个了. Java中的内存泄露当然是指:存在无用但是垃
浅谈Java 类中各成分加载顺序和内存中的存放位置

一.什么时候会加载类? 使用到类中的内容时加载:有三种情况 1.创建对象:new StaticCode(); 2.使用类中的静态成员:StaticCode.num=9; StaticCode.show(); 3.在命令行中运行:java StaticCodeDemo 二.类所有内容加载顺序和内存中的存放位置利用语句进行分析: 1.Person p=new Person("zhangsan",20); 该句话所做的事情: 1.在栈内存中,开辟main函数的空间,建立main函数的变量
浅谈Java继承中的转型及其内存分配

看书的时候被一段代码能凌乱啦,代码是这样的: package 继承; abstract class People { public String tag = "疯狂Java讲义"; //① public String name = "Parent"; String getName(){ return name; } } class Student extends People { //定义一个私有的tag实例变量来隐藏父类的tag实例变量 String tag =
浅谈Java并发编程之Lock锁和条件变量

简单使用Lock锁 Java 5中引入了新的锁机制--java.util.concurrent.locks中的显式的互斥锁:Lock接口,它提供了比synchronized更加广泛的锁定操作.Lock接口有3个实现它的类:ReentrantLock.ReetrantReadWriteLock.ReadLock和ReetrantReadWriteLock.WriteLock,即重入锁.读锁和写锁.lock必须被显式地创建.锁定和释放,为了可以使用更多的功能,一般用ReentrantLock为其实例
浅谈java线程中生产者与消费者的问题

一.概念生产者与消费者问题是一个金典的多线程协作的问题.生产者负责生产产品,并将产品存放到仓库:消费者从仓库中获取产品并消费.当仓库满时,生产者必须停止生产,直到仓库有位置存放产品:当仓库空时,消费者必须停止消费,直到仓库中有产品. 解决生产者/消费者问题主要用到如下几个技术:1.用线程模拟生产者,在run方法中不断地往仓库中存放产品.2.用线程模拟消费者,在run方法中不断地从仓库中获取产品.3 . 仓库类保存产品,当产品数量为0时,调用wait方法,使得当前消费者线程进入等待状态,当有新
浅谈java继承中是否创建父类对象

1. 调用父类构造方法是真的,但是根本没有创建父类对象,只不过是调用父类构造方法来初始化属性. 如果说调用父类构造方法就等于创建父类对象,那就真的无稽之谈. new指令开辟空间,用于存放对象的各个属/性引用等,反编译字节码你会发现只有一个new指令,所以开辟的是一块空间,一块空间就放一个对象. 然后,子类调用父类的属性,方法啥的,那并不是一个实例化的对象. 在字节码中子类会有个u2类型的父类索引,属于CONSTANT_Class_info类型,通过CONSTANT_Class_info的描述可以
浅谈Java编程中string的理解与运用

一,"=="与equals() 运行以下代码,如何解释其输出结果? public class StringPool { public static void main(String args[]) { String s0="Hello"; String s1="Hello"; String s2="He"+"llo"; System.out.println(s0==s1);//true System.out
浅谈Java开发中的安全编码问题

1 - 输入校验编码原则:针对各种语言本身的保留字符,做到数据与代码相分离. 1.1 SQL 注入防范严重性高,可能性低. (1) 参数校验,拦截非法参数(推荐白名单): public String sanitizeUser(String username) { return Pattern.matches("[A-Za-z0-9_]+", username) ? username : "unauthorized user"; } (2) 使用预编译: Stri

浅谈Java并发中的内存模型

相关推荐

随机推荐