大数据技术的基础技能包括什么(大数据技术的基础是什么)
470
2022-05-30
@TOC
一、前言
应聘后端开发岗位面试过程中,有关JVM的问题必不可少,此篇博文主要梳理有关JVM工作原理、收集器有关内容。
二、java 内存与内存溢出
2.1 JVM 分区及作用
程序计数器(线程私有)
当前线程执行字节码的信号指示器。(每个线程都会在程序计数器中存储其指令,从而实现线程切换后恢复到正确的执行位置)
虚拟机栈(栈,线程私有)
每个方法执行(开始到结束就是这个方法的生命周期)都会创建一个栈帧,栈帧存储局部变量表、操作数栈、动态链接、方法出口等信息。
(栈内存)为虚拟机执行java方法服务:方法被调用时创建栈帧–>局部变量表–>局部变量–>对象引用
如果线程请求的栈深度超出了虚拟机所允许的深度,就会出现StackOverFlowError. -Xss规定了栈的最大空间;
虚拟机栈可以动态扩展,如果扩展到无法申请到足够的内存,会出现OOM(OutOfMemoryError)
而我们最常用的就是局部变量表,局部变量表包括如下内容:
基本数据类型: boolean byte char short int float long double
注意基本类型的包装类型:Boolean、Byte、Character、Short、Integer、Float、Long、Double
对象引用类型:类、接口、数组 (不是对象本身,可能是一个指向对象起始地址的引用指针)
问题:包装类型是放在栈中么:String Interget(看包装类型是怎么用的:若直接定义则内容在常量池中,若new一个对象则在堆中。)
本地方法栈 。与虚拟机实现的功能非常相似,不同之处在于虚拟机执行java方法(字节码)服务,而本地方法栈执行Native 方法服务(非java方法写的)。
java 堆。(线程共享) 虚拟机启动时创建,此内存区域的唯一目的就是存放对象实例,对象在失去引用,就会被java虚拟机回收。
被所有线程共享,在java虚拟机启动时创建,几乎所有的对象实例都存放到堆中;
GC管理的主要区域;
物理上不连续,逻辑上连续,并可以动态扩展,无法扩展时抛出OutOfMemoryError;
方法区(线程共享)(虚拟机把方法区叫做永久代)。
用于存储已被虚拟机加载的类信息、常量、静态变量、即编译器编译后的代码等数据。
注意⚠️:特别注意静态变量static修饰的变量在方法区。
直接内存(了解即可)
不是虚拟机运行时数据区的一部分。是native函数直接分配的堆外内存,这样避免了java堆和native堆来回复制数据。
三、垃圾收集器与内存分配策略
3.1 jvm垃圾处理方法(标记清除、复制、标记整理)
标记—清除算法
标记阶段:先通过根节点,标记所有从根节点开始的对象,未被标记的视为垃圾对象;
清除阶段:清除所有未被标记的对象。
复制算法
将原有的内存空间分成两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中存活对象复制到未使用的内存块中,然后清除正在使用的内存块中所有对象。
标记—整理算法
若对象存活率比较高,就要进行多次复制,效率比较低。
标记阶段:先通过根节点,标记所有从根节点开始的可达对象,未被标记的视为垃圾对象。
整理阶段:将所有的存活对象压缩到内存的一端(或向一端移动),之后清理边界所有的空间。
分代收集算法
只是根据对象存活周期的不同将内存划分为几块。一般把java堆分为新生代和老年代。
新生代大量对象死亡,只有少数对象存活,采用复制算法;
老年代对象存活率高,没有额外空间对它进行分配,故采用标记-清除或标记-整理算法。
三种算法的比较:
效率:复制算法 > 标记-整理算法 > 标记-清除算法(此处的效率只是简单的对比时间复杂度)
内存整理度:复制算法 = 标记-整理算法 》标记-清除算法
内存利用率:标记-整理算法 = 标记-清除算法 》复制算法
3.2 JVM如何GC?新生代,老年代,持久代,都存储哪些东西,以及各个区的作用?
大多数新生的对象在Eden区分配,当Eden区没有足够空间进行分配时,虚拟机就会进行一次Minor GC。(Survivor是两个)
1. 新生代
在方法中new一个对象,方法调用完毕后,对象就会被回收,这就是一个典型的新生代对象。(新生对象在eden区经历过一次minorGC并且被Survivor容纳的话,对象年龄为1,每一次熬过MinorGc 年龄就会加1,直到15,就会晋升到老年。)
注意动态对象的判定:Survivor空间中相同年龄的对象大小总和大于Survivo空间的一半,大于或等于该年龄的对象就可以直接进入老年代。
老年代
在新生代中经历了N次垃圾回收后仍然存活的对象,就会被放到老年代中,而且大对象(占用大量连续内存空间的java对象如很长的字符串及数组)直接进入老年代。
当survivor空间不够用时,需要依赖老年代进行分配担保。
3.3 GC 引用可达性分析算法中 GCRoots 对象
java虚拟机栈中的对象(引用对象);
方法区中的静态成员;
方法区中的常量引用对象;
本地方法区中的JNI(Native方法)引用对象 ;
3.4 MinorGC、FullGC时机
1. MinorGC(新生代GC)
当Eden区没有足够空间进行分配时,虚拟机就会进行一次Minor GC。
新生代中的垃圾收集动作,采用的是复制算法;
对于较大的对象(很长的字符串、数据、集合),在Minor GC的时候可以直接进入老年代。
2. FullGC(老年代GC)
Full GC 是发生在老年代的垃圾收集动作,采用的是标记-清除/整理算法;
由于老年代的对象几乎都是在survivor区熬过来的,不会那么容易死掉,因此Full GC发生的次数不会像MInor GC那么频繁,Full GC清理时间是Minor GC的10倍。
3.5 各垃圾回收器工作原理
是一个单线程收集器,它“单线程”的意义并不仅仅说明它只会使用一个cpu或一条线程去完成垃圾回收工作。而是在收集垃圾时,暂停其他的工作线程。
新生代采用复制算法,stop-the-world(消除或者减少工作线程因内存回收而导致停顿)。
老年代采用标记–整理算法。
简单高效,client模式下默认的新生代收集器。
ParNew收集器是Serial收集器的多线程版本;
新生代采用复制算法,stop-the-world;
老年代采用标记–整理算法;
它是运行在server模式下首选新生代收集器;
除了serial收集器之外,只能它能和cms收集器配合工作。
类似ParNew,但是更加关注吞吐量。目标是:达到一个可控制吞吐量的收集器;
停顿时间和吞吐量不可能同时调优。我们一方面希望停顿时间少,另一方面希望吞吐量高,其实这是矛盾的。
因为:在GC的时候,垃圾回收的工作量是不变的,如果停顿时间减少,那频率就会提高;既然频率提高了,说明就会频繁的进行GC,那吞吐量就会减少,性能就会降低。
是当今收集器发展的最前沿成果之一,对垃圾回收进行划分优先级的操作,这种有优先级的区域回收方法保证了它的高效率;
最大的优点是结合了空间整合,不会产生大量的碎片,也降低了进行GC的频率;
让使用者明确指定停顿的时间。
一种以获得最短回收停顿时间为目标的收集器,适用于互联网网站或者B/S系统的服务器上;
初始化标记(stop-the-world):根可以直接关联到的对象;
并发标记(和用户线程一起):主要标记过程,标记全部对象;
重新标记(stop-the-world):由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正;
并发清除(和用户线程一起):基于标记结果,直接清理对象。
注意:CMS有三个致命的问题:
cpu资源占用;
浮动的垃圾无法清除;
内存碎片;
3.6 java 引用类型
Java有四种引用类型:
强引用:通过new产生的对象都是强引用。
软引用:一些还有用但不是必须的对象可以使用软引用。比如创建一个软引用数组,这个数组存放了100多个学生对象的信息。内存比较空闲的时候这些对象和强引用没有区别,但内存紧张的时候就会被GC回收。(这就是GC的判定条件)
应用软引用的好处:java在内存不足时,程序不会崩溃;
弱引用:描述非必须对象的(比软引用更弱),当GC工作时,无论内存是否紧张都会回收掉;当某个对象是偶尔使用,并且在使用时随时能获取,又不想影响垃圾的回收,可以考虑应用这个。
虚引用:无法通过虚引用来获取对一个对象的真实引用。唯一的用处:能在对象被GC时收到系统通知,JAVA中用PhantomReference来实现虚引用。
Java JVM
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。