运行时数据区域
Java 虚拟机在执行 Java 程序的过程中会把所管理的内存划分为若干个不同的数据区域。Java 虚拟机所管理的内存包括以下几个运行时数据区域:
Class文件通过类加载器进行加载后,不同的数据分布在不同的区域,然后经过执行引擎来进行执行。
一个线程的图示
通过一个例子来分析一个线程的运行
可以使用 javap 进行反汇编 class 文件。
源代码:
1 | package com.enjoyms.study; |
通过 sublime 打开 Test2.class 文件如下:
1 | cafe babe 0000 0037 0029 0a00 0600 1b0a |
可以使用 javap 命令进行反编译成 JVM 指令。
javap -c Test2.class >> Test2.txt
生成的 Test2.txt 如下:
1 |
|
Code 部分的指令可以通过查询 JVM 指令集 来获取指令的含义。
简要执行图:
局部变量表
局部变量表是用来存储变量的, 操作数栈是从局部变量表里取数据,然后提供数据进行运算的。
关于栈帧的执行顺序可以看这一篇文章,上图的顺序不代表真实的顺序。栈帧函数调用讲解
动态链接
每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。因为 Class 文件常量池中存在大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用一部分会在类加载阶段或第一次使用的时候直接转化为直接引用,这种转化称为静态解析。另一部分将在每一次的运行期间转化为直接引用,这部分称为动态连接。
符号引用和直接引用:可以粗略理解为符号引用的对象并不能直接使用,需要转化为直接引用才可以使用。
方法出口
方法退出有两种方式,一种是正常退出,一种是异常退出,无论采用何种方式退出,在方法退出后,都需要返回到方法被调用的位置,程序才能继续执行,方法返回时可能需要在栈帧中保存一些信息,用来帮助它的上层方法的执行状态。
程序计数器
程序计数器是一块较小的内存空间,它的作用是记录当前线程执行的字节码的行号。Java 虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的。为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储。属于线程私有内存。
如果一个线程正在执行一个 Java 方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是 Native 方法,这个计数器则为空。此区域是唯一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域。
如上面的图,在将 .class 文件反编译成 JVM指令集,每一个 code 下面的指令都有编号,程序计数器就是保存当前执行到的行号,以便下次执行知道从哪里开始执行。
虚拟机栈
Java 虚拟机栈为线程私有的,它的生命周期与线程相同。每个方法被执行的时候回创建一个栈帧。用于存储局部变量表、操作栈、动态链接,方法出口等信息。每一个方法被调用知道执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
栈帧中的局部变量表:
存放了编译期可知的八种基本数据类型、对象引用和 returnAddress 类型(指向一条字节码指令的地址)。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要的栈帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
此区域规定了两种异常:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出 StackOVerflowError 异常。如果虚拟机栈的大小可以动态扩展,但是无法申请到足够的内存将会抛出 OutOfMemoryError 异常。
本地方法栈
本地方法栈与虚拟机栈发挥的作用非常相似,区别是虚拟机栈执行的是 Java 方法,而本地栈则是虚拟机使用到的 Native 方法服务。同样,本地方法栈区域也会抛出相同的异常。JDK 默认的虚拟机 HotSpot 虚拟机 直接就把本地方法栈和虚拟机栈合二为一。
方法区
方法区属于线程共享的内存区域。它存储已被虚拟机加载的类的信息、常量、静态变量、即时编译器编译后的代码等数据。方法区被描述为堆的一个逻辑部分。
关于如何理解 ”方法区被描述为堆的一个逻辑部分“下面 Java 堆会说。
虽然 Java虚拟机规范把方法区描述为堆的一个逻辑不笨,但是它却又一个别名叫做 Non-Heap(非堆),目的应该是与 Java堆区分开来。
垃圾收集行为在这个区域是比较少出现的。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。
运行时常量池
是方法区的一部分。Class 文件除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
除了保存 Class 文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。
运行时常量池相对于Class 文件常量池的另一个重要特征是具备动态性,Java语言并不要求常量一定只能在编译期产生,也就是并非预置Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被用的比较多的便是 String 类的 intern() 方法。
当常量池内存无法再申请得到时,会抛出 OutOfMemoryError 异常。
Java 堆
Java堆 一般是 Java 虚拟机所管理的内存中最大的一块,并且是线程共享的一块内存区域,在虚拟机启动时创建。
此区域的唯一目的就是存放对象实例,几乎所有的对象实例及数组都要在堆上分配。
Java堆 也是垃圾收集器管理的主要区域。
下图是堆的划分图:(JDK 1.8 及以上),划分区域是为了更好的配合垃圾回收算法。
Java 堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。堆无法扩展时,会抛出 OutOfMemoryError 异常。
在 JDK1.8 以前,是不存在 MetaData 的, 称为 永久代,永久代所用的内存是堆的内存,而 MetaData 用的内存是直接内存,区别就是 JDK 1.8 实现了方法区的信息与 Java堆 内存隔离开来。
方法区是一个逻辑抽象的概念,而主要实现,和方法区里存储的信息是在 MetaData(元空间 ) 里面进行实现的。(以前的实现实在永久代实现的)
方法区、永久代、MetaData 三者并不能混为一谈。
直接内存
直接内存不属于虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁使用,而且也可能导致 OutOfMemoryError 异常。
如在 JDK1.4 中新加入了 NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O 方式,它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆里面的 DirectByteBuffer 对象作为这块内存的引用来进行操作。这样能在一些场景中显著提高性能,因为避免了在 Java 堆和 Native 堆中来回复制数据。
本机直接内存的分配不会受到 Java 堆大小限制。
对象访问的方式
主流的访问方式有两种:使用句柄和直接指针。
通过句柄访问对象
如果使用句柄访问方式,Java 堆中将会划分出一块内存来作为句柄池,reference 中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。
使用句柄访问方式的最大好处就是 reference 中存储的是稳定的句柄地址,在对象被移动(垃圾收集移动对象是非常普遍的行为)时只需要改变句柄中的实例数据指针,而 reference 本身不需要被修改。
通过直接指针访问对象。
使用直接指针访问方式的最大好处是速度更快,它节省了一次指针定位的时间开销,由于对象的访问在 Java 中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。HotSpot 使用的是 直接指针访问对象。
参考 《深入理解Java虚拟机》