JVM内存结构
Java虚拟机内存结构可分为公有和私有两部分,公有指的是所有线程都共享的部分,指的是java堆、方法区、常量池。私有指的是每个线程的私有数据,包括pc寄存器、Java虚拟机栈、本地方法栈。
公有部分:Java堆、方法区、常量池
Java堆指的是从JVM中划分出来的一块区域,这块区域专门用于Java实例对象的内存分配,几乎所有的实例对象都会在这里进行内存的分配,但有的小对象会直接在栈上分配。
Java堆根据对象存活时间不同,分为年轻代,老年代两个区域,年轻代还被分为Eden区、From Survivor空间、To Survivor空间,如下图。
当有对象要分配的时候,一个对象永远都是先被分到年轻代的Eden区,等到Eden区内存不够时,JVM会启动垃圾回收。此时Eden区中没有被引用的对象的内存会被回收,在JVM中有一个名为 -XX:MaxTenuringThreshold 的参数专门来设置晋升到老年代所需要经历的GC次数,当在年轻代的对象经过了一定次数的GC后,在下一次GC进入老年代。
Java划分区域的原因是:在Java中会有存活时间长的对象也有存活时间短的对象,如果混在一起,如果存活时间短的对象多的话就会出现频繁的垃圾回收,而每次垃圾回收时都要进行全部内存的扫描,这样的话对于存活时间很长对象来说无异于是浪费,为了提高垃圾回收的效率,就出现了分区。
Why默认虚拟机配置 Eden:From :To = 8:1:1。
这是IBM公司统计得出的结论:发现80%对象存活时间都很短,所以将Eden区设置为年轻代80%,可以减少内存空间浪费,提高内存空间利用率。
方法区 指存储Java类字节码数据的一块区域,存储类信息、常量、静态变量等数据,是线程共享的区域,为了与Java堆区分,方法区有一个别名叫NonHeap。它存储了每一个类的结构信息,比如运行时的常量池、字段和方法数据、构造方法等。其实常量池是存在在方法区中的,但《Java虚拟机规范》将常量池和方法区放在同一等级。
私有部分:PC寄存器,Java虚拟机栈,本地方法栈
PC寄存器,Program Counter寄存器(程序计数器),用来保存线程当前正在执行的方法。功能是存放伪指令,更确切的说存放的是将要执行指令的地址,它甚至可以是操作系统指令的本地地址,当虚拟机正在执行的方法是一个本地方法的时候,jvm的pc寄存器存储的值是undefined,虚拟机的pc寄存器是用于存放下一条将要执行的指令的地址(字节码流)。
对于一个运行中的Java程序而言,其中的每一个线程都有它自己的PC(程序计数器)寄存器,它是在该线程启动时创建的,PC寄存器的大小是一个字长,很小,因此它既能够持有一个本地指针,也能够持有一个returnAddress(finally块)。当线程执行某个Java方法时,PC寄存器的内容总是下一条将被执行指令的“地址”,这里的“地址”可以是一个本地指针,也可以是在方法字节码中相对于该方法起始指令的偏移量。如果该线程正在执行一个本地方法,那么此时PC寄存器的值是“undefined”。
Java虚拟机栈, 这个栈与线程同时创建,用来储存栈帧,也就是存储局部变量与一些过程结果的地方。栈帧存储的数据包括:局部变量表,操作数栈。
JMM
参考文章:
https://www.jianshu.com/p/8a58d8335270
https://www.cnblogs.com/nexiyi/p/java_memory_model_and_thread.html
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样底层细节。此处的变量与Java编程时所说的变量不一样,指包括了实例字段、静态字段和构成数组对象的元素,但是不包括局部变量与方法参数,后者是线程私有的,不会被共享。
Java虚拟机规范中定义了Java内存模型(Java Memory Model,JMM),实现了多平台可移植性,JMM规范了Java虚拟机与计算机内存是如何协同工作的:规定了一个线程如何和何时可以看到由其他线程修改过后的共享变量的值,以及在必须时如何同步的访问共享变量。
Java内存模型:调用栈和本地变量存放在线程栈上,对象存放在堆上。
- 一个本地变量可能是原始类型,在这种情况下,它总是“呆在”线程栈上。
- 一个本地变量也可能是指向一个对象的一个引用。在这种情况下,引用(这个本地变量)存放在线程栈上,但是对象本身存放在堆上。
- 一个对象可能包含方法,这些方法可能包含本地变量。这些本地变量仍然存放在线程栈上,即使这些方法所属的对象存放在堆上。
- 一个对象的成员变量可能随着这个对象自身存放在堆上。不管这个成员变量是原始类型还是引用类型。
- 静态成员变量跟随着类定义一起也存放在堆上。
- 存放在堆上的对象可以被所有持有对这个对象引用的线程访问。当一个线程可以访问一个对象时,它也可以访问这个对象的成员变量。如果两个线程同时调用同一个对象上的同一个方法,它们将会都访问这个对象的成员变量,但是每一个线程都拥有这个成员变量的私有拷贝。
从抽象的角度来看,JMM定义了线程和主内存之间的抽象关系:
- 线程之间的共享变量存储在主内存(Main Memory)中
- 每个线程都有一个私有的本地内存(Local Memory),本地内存是JMM的一个抽象概念,并不真实存在,它涵盖了缓存、写缓冲区、寄存器以及其他的硬件和编译器优化。本地内存中存储了该线程以读/写共享变量的拷贝副本。
- 从更低的层次来说,主内存就是硬件的内存,而为了获取更好的运行速度,虚拟机及硬件系统可能会让工作内存优先存储于寄存器和高速缓存中。
- Java内存模型中的线程的工作内存(working memory)是cpu的寄存器和高速缓存的抽象描述。而JVM的静态内存储模型(JVM内存模型)只是一种对内存的物理划分而已,它只局限在内存,而且只局限在JVM的内存。
JMM模型下的线程间通信:
线程间通信必须要经过主内存。
如下,如果线程A与线程B之间要通信的话,必须要经历下面2个步骤:
1)线程A把本地内存A中更新过的共享变量刷新到主内存中去。
2)线程B到主内存中去读取线程A之前已更新过的共享变量。
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种操作来完成:
- lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
- unlock(解锁):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
- load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
- assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
- store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作。
- write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。
Java内存模型还规定了在执行上述八种基本操作时,必须满足如下规则:
- 如果要把一个变量从主内存中复制到工作内存,就需要按顺寻地执行read和load操作, 如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。但Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。
- 不允许read和load、store和write操作之一单独出现
- 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
- 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
- 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。
- 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现
- 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
- 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
- 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)。
JMM解决的问题
1.多线程读同步与可见性
- volatile
- synchronized
- final
2.多线程写同步与原子性
- Atom
- synchronized
volatile总结 (保证内存可见性:Lock前缀的指令、内存屏障禁止重排序)
synchronized总结 (保证内存可见性和操作原子性:互斥锁;锁优化)