元元元元元yuan

垃圾收集算法和各种垃圾收集器的实现

深入理解Jvm虚拟机第三章

- 二、对象已死？
- - 3.2.1 引用计数算法
  - 3.2.2 可达性分析算法
  - 3.2.3 再谈引用
  - 3.2.4 生存还是死亡
  - 3.2.5 回收方法区
- 三、垃圾收集算法
- - 3.3.1 分代收集理论
  - 3.3.2 标记-清除算法
  - 3.3.3 标记-复制算法
  - 3.3.4 标记-整理算法
- 四、HotSpot的算法细节实现
- - 3.4.1 根节点枚举
  - 3.4.2 安全点
  - 3.4.3 安全区域
  - 3.4.4 记忆集与卡表
  - 3.4.5 写屏障
  - 3.4.6 并发的可达性分析
- 五、经典垃圾收集器
- - 3.5.1 Serial收集器
  - 3.5.2 ParNew收集器
  - 3.5.3 Parallel Scavenge 收集器
  - 3.5.4 Serial Old收集器
  - 3.5.5 Parallel Old收集器
  - 3.5.6 CMS收集器
  - 3.5.7 Garbage First收集器
- 六、低延迟垃圾收集器
- - 3.6.1 Shenandoah收集器
  - 3.6.2 ZGC收集器
- 七、选择合适的垃圾收集器
- - 3.7.1 Epsilon收集器
  - 3.7.2 收集器的权衡
  - 3.7.3 虚拟机及垃圾收集器日志
  - 3.7.4 垃圾收集器参数总结
- 八、实战：内存分配与回收策略
- - 3.8.1 对象优先在Eden分配
  - 3.8.2 大对象直接进入老年代
  - 3.8.3 长期存活的对象进入老年代
  - 3.8.4 动态对象年龄判定
  - 3.8.5 空间分配担保

二、对象已死？

在堆中存放着几乎所有的对象实例，垃圾收集器在对堆进行回收前第一件事就是要确定这些对象之中哪些还“活着”，哪些已经“死去”（不再被任何途径使用的对象）

3.2.1 引用计数算法

在对象中添加一个引用计数器，每当有一个地方引用它时，计数器值就加一；当引用失效时，计数器值就减一；任何时刻计数器为零的对象就是不可能再被引用的。

虽然这种方法是简单高效的，但是还有一种例外情况：例如A对象引用B对象，B对象引用A对象，并且两个对象都已经不可能再被访问，这时虽然两个对象应该被回收但是由于计数器值不为0所以回收不了。

3.2.2 可达性分析算法

该算法的基本思路为通过一系列称为“GC Roots”的根对象作为起始节点集，从这些结点开始根据引用关系向下搜索，搜索过程中走过的路径称为“引用链”，如果某个对象到“GC Roots”间没有任何引用链相连，则证明此对象是不可能再被使用的。

在Java技术体系里，固定可作为GC Roots的对象包括以下几种

在虚拟机栈（栈帧中的本地变量表）中引用的对象，譬如当前正在运行的方法所使用到的参数、局部变量、临时变量等
在方法区中静态属性引用的对象，譬如Java类的引用类型静态变量
在方法区中常量引用的对象，譬如字符串常量池里的引用
在本地方法栈中JNI（即通常所说的Native方法）引用的对象
Java虚拟机内部的引用，如基本数据类型对应的Class对象，一些常驻的异常对象，还有系统类加载器
所有被同步锁持有的对象
反应Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等

如果只针对 Java 堆中的某一块区域进行垃圾回收（比如：典型的只针对新生代），必须考虑到内存区域是虚拟机自己的实现细节，更不是孤立封闭的，这个区域的对象完全有可能被其他区域的对象所引用，这时候就需要一并将关联的区域对象也加入 GCRoots 集合中去考虑，才能保证可达性分析的准确性。
也就是说，进行

局部回收的时候，也要考虑到该内存区域里的对象是否也被其他内存区域引用到

3.2.3 再谈引用

在JDK1.2之前，Java里面的引用是很传统的定义：如果reference数据是代表某块内存、某个对象的引用。这种定义并没有什么不对，但是对于描述一些“食之无味，弃之可惜”的对象就显得无能为力。譬如我们希望能描述一类对象：当内存空间足够时，能保留在内存中，如果内存空间在进行垃圾收集后仍然非常紧张，那就可以抛弃这些对象。

在JDK1.2之后，Java堆引用的概念进行了扩充，将引用分为强引用、软引用、弱引用和虚引用。这四种引用强度以此逐渐减弱

强引用类似“Object obj = new Object()”，无论任何情况下，只要强引用关系还存在，垃圾收集器就永远不会回收掉被引用的对象
软引用是用来描述一些还有用，但非必须的对象。只要被软引用关联着的对象，在系统将要发生内存溢出异常前，会把这些对象列进回收范围之中进行二次回收，如果这次回收还没有足够的内存，在会抛出内存溢出异常，SoftReference
弱引用的强度比软引用更弱一些，被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作，无论当前的内存是否足够，都会回收掉只被弱引用关联的对象，WeakReference
虚引用也成为“幽灵引用”或者“幻影引用”，是最弱的一种引用关系。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知，PhantomReference

3.2.4 生存还是死亡

一个对象真正死亡，最多会经历两次标记过程：如果对象不可达，那么会被第一次标记，然后进行一次筛选，筛选的条件是此对象是否有必要执行finalize（）方法。假如对象没有覆盖finalize（）方法或者finalize（）方法已经被虚拟机调用过，那么虚拟机将这两种情况都视为“没有必要执行”。

如果对象在finalize（）中成功拯救自己，只需要重新与引用链上任何一个对象建立关联即可（重新被引用引用到）。

3.2.5 回收方法区

方法区的垃圾收集主要回收两部分内容：废弃的常量和不再使用的类型。回收废弃常量与回收Java堆中的对象非常类似。

判断一个类型是否属于“不再被使用的类”的条件就比较苛刻了。需要同时满足下面三个条件：

该类所有的实例都已经被回收，也就是Java堆中不存在该类及其任何派生子类实例
加载该类的类加载器已经被回收，这个条件除非是经过精心设计的可替换类加载器的场景，如OSGi、JSP的重加载等，否则通常是很难达成的
该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法

在大量使用反射、动态代理、CGLib等字节码框架，动态生成JSP以及OSGi这类频繁自定义类加载器的场景中，通常都需要Java虚拟机具备类型卸载的能力，以保证不会对方法区造成过大的内存压力

三、垃圾收集算法

垃圾收集算法主要分为‘引用计数式垃圾收集“和”追踪式垃圾收集“两大类，这两类也常被称作”直接垃圾收集“和”间接垃圾收集“，由于主流Java虚拟机中均未涉及引用计数式垃圾收集算法，所以本节介绍的所有算法均属于追踪式垃圾收集范畴

3.3.1 分代收集理论

当前商业虚拟机的垃圾收集器，大多遵循了”分代收集“理论进行设计，建立在两个分代假说之上：

弱分代假说（Weak Generational Hypothesis）：绝大多数对象都是朝生夕灭的
强分代假说（Strong Generational Hypothesis）：熬过越多次垃圾收集过程的对象就越难以消亡

显而易见，收集器应该将Java堆划分出不同的区域，然后将回收对象依据其年龄（对象熬过垃圾收集过程的次数）分配到不同的区域中存储。

在堆划分出不同的区域之后，GC才可以每次只回收其中一个或者某部分区域，也才能够针对不同的区域安排与里面存储对象存亡特征相匹配的垃圾收集算法。并且发展出了“标记-复制算法”“标记-清除算法”“标记-整理算法”

设计者一般至少会把Java堆划分成新生代和老年代两个区域。但是分代收集并非只是划分一下内存区域那么容易，至少存在一个明显的困难：对象不是孤立的，对象之间会存在跨代引用

跨代引用假说：跨代引用相对于同代引用仅占极少数

根据这条假说，我们不必为了少量的引用去扫描整个老年代，也不必浪费空间专门记录每一个对象是否存在及存在哪些跨代引用，只需要在新生代上建立一个全局的数据结构（记忆集）这个结构把老年代划分成若干小块，标识出老年代的哪一块内存会存在跨代引用。之后当发生MinorGC时，只有包含了跨代引用的小块内存里的对象才会被加入到GC Roots进行扫描

3.3.2 标记-清除算法

算法分为“标记”和“清除”两个阶段：首先标记出所有要回收的对象，在标记完成后，统一回收掉所有被标记的对象，或者反过来，首先标记所有需要回收的对象，在标记完成后，统一回收掉所有被标记的对象。

它的主要缺点有两个：

执行效率不稳定：如果Java堆中包含大量对象，而且其中大部分是需要被回收的，这时必须进行大量标记和清除的动作，导致标记和清除两个过程的执行效率都随对象数量的增长而降低
内存空间碎片化：标记、清除后会产生大量不连续的内存碎片，空间碎片太多可能会导致之后存储较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作

3.3.3 标记-复制算法

这种算法将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块内存用完了，就将还活着的对象复制到另一块上面，然后再把已使用过的内存空间一次清理掉。如果内存中多数对象都是存活的，那么这种算法将会产生大量的内存复制的开销，但对于多数对象都是可回收的情况，算法需要复制的就是占少数的存活对象，这样实现简单，运行高效。但是缺点显而易见：复制回收算法的代价是将可用内存缩小为了原来的一半

IBM公司曾经研究出：新生代中的对象有98%熬不过第一轮收集。因此并不需要按照1：1的比例来划分新生代的内存空间。

Appel式回收的具体做法是把新生代分为一块较大的Eden空间和两块较小的Survivor空间，每次分配内存只使用Eden和其中一块Survivor，发生垃圾收集时，将Eden和Survivor中仍然存活的对象一次性复制到另外一块Survivor空间上，然后直接清理掉Eden和已用过的那块Survivor空间。

HotSpot虚拟机默认Eden和Survivor的大小比例是8：1，即每次新生代中可用内存空间为整个新生代容量的90%。但是无法保证每次回收都只有不多于10%的对象存活因此Appel式回收还有一个“逃生门”设计，当Survivor空间不足以容纳一次存活对象时，就需要依赖其他区域（大多数情况下为老年代）进行分配担保

3.3.4 标记-整理算法

标记复制算法在对象存活率较高的老年代中并不适用，因为很大概率会遇见所有对象都存活的极端情况，所以老年代中一般不能直接选用这种算法

针对老年代对象的死亡特征，提出了一种“标记-整理”算法，标记过程与“标记-清除”算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活对象都向内存空间一端移动，然后直接清理掉边界以外的内存

是否移动回收后的存活对象是一项优缺点并存的风险决策:

如果要移动存活对象：尤其是老年代这种每次回收都有大量对象存活的区域，移动对象并更新所有这些对象的引用是一项艰巨的操作，并且这项操作需要暂停用户应用程序才能进行。
如果不移动和整理存活对象，弥散于堆中的存活对象导致的空间碎片化问题就只能依赖更为复杂的内存分配器和内存访问器解决（例如分区空闲分配链表），内存访问是用户程序最频繁的操作，如果这个环节上增加了额外的负担，必然会直接影响应用程序吞吐量

所以是否移动对象都存在弊端，移动对象则回收对象更复杂，不移动对象则内存分配更复杂。吞吐量的本质是复制器于收集器的效率总和，即使不移动对象会使收集器的效率提升一些，但因内存分配和访问相比垃圾收集频率更高，这部分的耗时增加，总吞吐量仍然是下降的

还有一种”和稀泥式“解决方案：让虚拟机平时使用标记-清除算法，直到内存空间的碎片化成都已经大到影响对象分配时，再采用标记-整理算法收集一次，以获得规整的内存空间

四、HotSpot的算法细节实现

3.4.1 根节点枚举

现在Java应用越做越大，逐个检查GC Roots下的引用肯定要消耗不少时间。迄今为止，所有收集器在根节点枚举这一步骤时都是必须暂停用户线程的，如果分析过程中，根节点集合的对象引用关系还在不断变化，那么分析结果准确性也就无法保证。这是导致垃圾收集过程必须停顿所有用户线程的一个重要原因

HotSpot中，使用一组称为OopMap的数据结构来得到哪些地方存放着对象引用，这样就不需要一个不漏的检查完所有执行上下文和全局的引用位置

3.4.2 安全点

由于引用关系的变化，如果为每一条指令都生成对应的OopMap，那么将会需要大量的时间和空间，这样垃圾收集伴随而来的空间成本就会变得很高昂

实际上HotSpot只是在”特定的位置“记录了这些信息，这些位置被称为安全点，这就要求了用户程序必须执行到达安全点后才能够暂停。因此，安全点的选定即不能太少也不能太多，太少会让收集器等待时间过长，太多会过分增大运行时的内存负荷。安全点的位置选取基本上是以是否具有让程序长时间执行的特征为标准进行选定的，因为每条指令执行的时间都非常短暂，程序不太可能因为指令流长度太长的原因长时间执行，”长时间执行“的最明显特征就是指令序列的复用，例如方法调用、循环跳转、异常跳转等。

另一个需要考虑的问题是，如何在垃圾收集发生时让所有线程都跑到最近的安全点，这里有两种方案：

抢先式中断：抢先式中断不需要线程的执行代码主动去配合，垃圾收集时，系统先把所有用户线程全部中断，如果发现有用户线程中断的地方不在安全点上，就恢复这条线程的执行，直到跑到安全点上。几乎没有虚拟机实现采用这种方案。
主动式中断：简单的设计一个标志位，各个线程不断的轮询这个标志，一旦发现终端标志为真时就自己在最近的安全点上主动终端挂起。轮询标志的地方和安全点是重合的，还要加上所有创建对象和其他需要在Java堆上分配内存的地方，这是为了检查是否即将发生垃圾收集，避免没有足够内存分配新对象

3.4.3 安全区域

安全点看似已经完美解决了如何停顿用户线程，但程序”不执行的时候“（即没有分配处理器时间，程序处于Sleep状态或者Blocked状态），这时程序无法走到安全的地方中断挂起自己，虚拟机也不可能等待线程重新被激活分配处理器时间。对于这种情况，就必须要引入安全区域来解决。

安全区域可以看作被扩展拉伸了的安全点，在这个区域中，引用关系不会发生变化。

当用户线程执行到安全区域里面的代码时，首先会标识自己已经进入了安全区域，这样当虚拟机要发起垃圾收集时就不必去管这些已声明自己在安全区域内的线程了。当线程要离开安全区域时，它要检查虚拟机是否已经完成了根节点枚举，如果完成了，那线程就当没事发生过，继续执行，否则它就必须一直等待，知道收到可以离开安全区域的信号为止。

3.4.4 记忆集与卡表

为了解决对象跨代引用所带来的问题，垃圾收集器在新生代中建立了名为”记忆集“的数据结构。记忆集是一种用于记录从非收集区域指向收集区域的指针集合的抽象数据结构。如果不考虑效率成本，最简单的实现可以用非收集区域中所有含跨代引用的对象数组来实现这个数据结构：

Class RememberedSet{
    Object[] set[OBJECT_INTERGENERATIONAL_REFERENCE_SIZE];
}

这种记录全部含跨代引用对象的实现方案，空间占用和维护成本都相当高昂，但是收集器只需要通过记忆集判断某一块非收集区域是否存在了指向收集区域的指针就可以了。所以设计者在设计之真的时候可以选择更为粗犷的记录粒度来节省记忆集的存储和维护成本。

字长精度：每个记录精确到一个字长，也就是一个跨代指针的物理内存地址的指针长度
对象精度：每个记录精确到一个对象，该对象里含有跨代指针
卡精度：每个记录精确到一块内存区域，该区域有对象含有跨代指针

第三种“卡精度”指的是用一种称为卡表的方式去实现记忆集，记忆集是一种抽象的数据结构，只定义了它的行为意图，没有定义行为的具体实现。卡表就是记忆集的一种具体实现，它定义了记忆集的记录精度、与堆内存的映射关系等。

卡表最简单的形式可以是一个字节数组，HotSpot虚拟机也是这样做的：

CARD_TABLE[this address >> 9] = 1;

字节数组的每一个元素都对应着其标识的内存区域中一块特定大小的内存块，这个内存块被称作“卡页”。一般来说，卡页大小都是以2的N次幂的字节数，通过上面的代码可以看出HotSpot使用的卡页为2的9次幂。如果卡表内存起始地址是0x0000，数组CARD_TABLE的0、1、2号元素分别对应了地址范围为0x0000-0x01FF,0x0200-0x03FF,0x0400-0x05FF的卡页内存块。

一个卡页的内存通常包含不止一个对象，如果卡页内存在跨代指针，那么对应卡表的数组元素值标识为1，称这个元素变脏。在垃圾收集时只需要把脏元素筛选出来，就能轻易地出哪些卡页内存块中包含跨代指针，并加入GC Roots。

3.4.5 写屏障

经过即时编译的代码已经是纯粹的机器指令流了，这时该如何在对象赋值的那一刻更新维护卡表？这就必须找到一个机器码层面的手段，把维护卡表的动作放到每一个赋值操作中。

写屏障可以看作虚拟机层面对“引用类型字段赋值”这个动作的AOP切面，在写之前的写屏障叫做写前屏障，在写之后的叫做写后屏障

为了避免伪共享问题，一种简单的解决方案是不采用无条件的写屏障，先检查卡表标记，当该卡表元素未被标记过的时候才将其标记为变脏：

if(CARD_TABLE[this address >> 9] != 1){
    CARD_TABLE[this address >> 9] = 1;
}

3.4.6 并发的可达性分析

要解决或者降低用户线程的停顿，就要先搞清楚为什么必须在一个能保障一致性的快照上才能进行对象图的遍历，为了弄清楚这个问题，我们引入三色标记作为工具辅助推导：

白色：表示对象尚未被垃圾收集器访问过，如果在分析结束的阶段，对象仍然是白色的，标识不可达
黑色：表示对象已经被垃圾收集器访问过，且这个对象的所有引用都已经扫描过。黑色的对象代表已经扫描过，并且是安全存活的
灰色：表示对象已经被垃圾收集器访问过，但这个对象上至少存在一个引用还没有扫描过

如果扫描时线程是冻结的，那么不会有任何问题。如果扫描时用户线程和扫描器是并发进行的，那么可能会产生两种后果：

把原本消亡的对象错误标记为存活，这会产生一些浮动垃圾，下次收集处理掉即可
把原本存活的对象标记为已消亡，程序肯定会因此发生错误

譬如用户线程将引用链上的一个灰色节点所有引用切断，并且又被黑色节点引用。这时即使白色节点还在引用链上，也不会被扫描到了。

当且仅当下面两个条件同时满足时，会产生“对象消失”的问题，即原本应该是黑色的对象被误标为白色：

赋值器插入了一条或多条从黑色对象到白色对象的新引用
赋值器删除了全部从灰色对象到该白色对象的直接或者间接引用

我们要解决并发扫描时的对象消失问题，只需要破坏这两个条件的任意一个即可。由此分别产生了两种解决方案：增量更新和原始快照

增量更新要破坏的是第一个条件：黑色对象插入新的白色引用时，将这个新插入的引用记录下来，并发扫描结束后再将这些记录过的黑色对象为根，重新扫描一次。也就是说黑色对象一旦插入新的只想白色对象的引用，就变回灰色对象了。

原始快照要破坏的是第二个条件：当灰色对象要删除指向白色对象的引用时，将要删除的引用记录下来，等并发扫描结束后，再将这些记录过的引用关系中的灰色对象为根，重新扫描一次。可以简化理解为：无论引用关系删除与否，都会按照刚开始扫描的那一刻对象图快照进行搜索。

在HotSpot中，增量更新和原始快照这两种解决方案都有实际应用

五、经典垃圾收集器

3.5.1 Serial收集器

Serial收集器是一个单线程收集器，这里的“单线程”不仅仅指的是它只会用一个处理器或者一条收集线程去完成垃圾收集工作，更重要的是它进行垃圾收集时，必须暂停其他所有工作线程，直到它收集结束。

事实上，Serial收集器仍然有着优于其他收集器的地方，那就是简单并且高效。对于内存资源受限的环境，它是所有收集器里额外内存消耗最小的。Serial收集器由于没有线程交互的开销，专心做垃圾收集自然可以获得最高的单线程收集效率。收集几十兆甚至一两百兆的新生代，垃圾收集的停顿时间完全可以控制在十几、几十毫秒、最多一百多毫秒以内。

3.5.2 ParNew收集器

ParNew收集器实质上是Serial收集器的多线程并行版本。

ParNew是不少运行在服务端模式下的HotSpot首选的新生代收集器，有一个很重要的原因就是除了Serial收集器外，只有它能与CMS收集器配合工作。

3.5.3 Parallel Scavenge 收集器

Parallel Scavenge也是一款基于标记-复制算法实现的新生代收集器，Parallel Scavenge的特点是它的目标是达到一个可控制的吞吐量。吞吐量就是处理器用于运行用户代码的时间与处理器总消耗时间的比值，即：

吞吐量 = 运行用户代码时间 / （运行用户代码时间+运行垃圾收集时间）

Parallel Scavenge收集器提供了两个参数用于精确控制吞吐量，分别是控制最大垃圾收集停顿时间的-XX:MaxGCPauseMillis参数以及直接设置吞吐量大小的-XX:GCTimeRatio参数

-XX:MaxGCPauseMillis参允许的值是一个大于0的毫秒数，收集器将尽力保证内存回收花费时间不超过用户设定值。但是垃圾收集停顿时间缩短是以牺牲吞吐量和新生代空间为代价换取的：系统把新生代调的小一点，但也直接导致垃圾收集发生的更频繁，停顿时间的确在下降，但吞吐量也降下来了
-XX:GCTimeRatio参数应设置为一个正整数，表示用户期望虚拟机消耗在GC上的时间不超过程序运行时间的1/（N+1）

Parallel Scavenge收集器还有一个参数：-XX:+UseAdaptiveSizePolicy。这是一个开关参数，当这个参数被激活后，虚拟机会根据当前系统的运行情况收集性能监控信息，动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量。这种调节方式称为垃圾收集的自适应调节策略。

3.5.4 Serial Old收集器

Serial Old是Serial收集器的老年代版本，同样是一个单线程收集器，使用标记-整理算法。这个收集器的主要意义是供客户端模式下的HotSpot虚拟机使用。如果在服务端，也有两种用途：

在JDK5以及之前的版本中与Parallel Scavenge收集器搭配使用
作为CMS收集器发生失败时的后备预案，在并发收集发生Concurrent Mode Failure时使用

3.5.5 Parallel Old收集器

ParallelOld收集器时Parallel Scavenge收集器的老年代版本，支持多线程并行收集，基于标记-整理算法实现。

这个收集器是在JDK6才开始提供的，在此之前，Parallel Scavenge收集器一直处于相当尴尬的状态，原因是如果新生代选择了Parallel Scavenge收集器，老年代除了Serial Old收集器以外别无选择，其他表现良好的老年收集器，如CMS无法与他配合工作。

由于老年代SerialOld收集器在服务端应用性能上的拖累，使用ParallelScavenge收集器也未必能在整体上获得吞吐量最大化的效果。

同样，由于单线程的老年代收集中无法充分利用服务器多处理器的并行处理能力，在老年代内存空间很大而且硬件规格比较高级的运行环境中，这种组合的总吞吐量甚至不一定比ParNew加CMS组合来得优秀

Parallel Old收集器出现后，“吞吐量优先”收集器终于有了比较名副其实的搭配组合，在注重吞吐量或者处理器资源较为稀缺的场合，都可以优先考虑Parallel Scavenge加Parallel Old收集器组合

3.5.6 CMS收集器

CMS收集器是一种以最短回收停顿时间为目标的收集器，一些Java应用的服务端上通常会较为关注服务的响应速度，希望系统停顿时间尽可能的短，以给用户带来良好的交互体验

从名字上就可以看出CMS收集器是基于标记-清除算法实现的，它的运作过程相对于前面几种收集器来说要更复杂一些，整个过程分为四个步骤：

初始标记
并发标记
重新标记
并发清除

初始标记、重新标记这两个步骤仍然需要暂停所有用户线程

初始标记仅仅是标记一下GC Roots能直接关联到的对象，速度很快；并发标记阶段就是从GC Roots的直接关联对象开始遍历整个对象图的过程，这个过程耗时较长但是不需要停顿用户线程，可以与垃圾收集线程一起并发运行。重新标记阶段则是为了修正并发标记期间，因用户程序继续运作而导致标记变动的那一部分对象的标记记录（增量更新和原始快照）。最后是并发清除，清除掉判断的已死亡的对象，由于不需要移动存活对象，所以这个阶段也是可以与用户线程同时并发的。

CMS是一款优秀的收集器：并发收集、低停顿。CMS是HotSpot虚拟机追求低停顿的第一次成功尝试，但是它还远远达不到完美的程度，至少有以下三个明显的缺点：

CMS对处理器资源非常敏感

面向并发设计的程序都对处理器资源比较敏感。在并发阶段，它虽然不会导致用户线程变慢，但却会因为占用了一部分线程导致总吞吐量降低。CMS默认启动的回收线程数是（处理器核心数量+3）/4，如果处理器核心数在四个或者以上，并发回收时垃圾收集器线程只占用不少于25%的处理器运算资源，并且会随着处理器核心数量的增加而下降。但是当处理器核心数量不足4个时，应用本来的处理器负载就很高，还要分出一半运算能力执行收集器线程，就可能导致用户线程的执行速度忽然大幅降低。为了缓解这种情况，虚拟机提供了一种称为“增量式并发收集器”的CMS收集器变种，在并发标记、清理的时候让收集器线程、用户线程交替运行，尽量减少垃圾收集线程的独占资源的时间，这样做整个垃圾收集过程会很长，但是对用户程序的影响就会显得较少，直观感受就是速度变慢的时间更多了，但是速度下降幅度没有那么明显。

CMS收集器无法处理“浮动垃圾”有可能出现“Concurrent Mode Failure”失败进而导致另一次完全“Stop The World”的Full GC产生。

在并发标记和并发清理阶段，用户线程还是在继续运行的，会有新的垃圾对象不断产生，但是这一部分垃圾对象CMS无法在档次收集中处理掉他们，只好留到下一次垃圾收集时再清理掉。这一部分垃圾就称为“浮动垃圾”。同样由于垃圾收集阶段用户线程需要持续运行，就需要预留足够的内存空间提供给用户线程使用，因此CMS不能等到老年代几乎被填满了再进行收集，必须预留一部分空间供并发收集时的程序运作使用。JDK5的默认设置下，老年代的触发百分比是68%，可以适当调高-XX:CMSInitiatingOccu-pancyFraction的值提高CMS的触发百分比。但是如果CMS运行期间预留的内存无法满足程序分配新对象的需要，就会出现一次“并发失败”，这是虚拟机不得不冻结用户线程的执行，临时调用Serial Old收集器来重新进行老年代的垃圾收集，但这样停顿的时间就长了。

CMS基于“标记-清除”算法实现

为了解决内存碎片化问题，CMS提供了一个-XX:UseCMSCompactAtFullCollection开关参数，用于在CMS收集器不得不进行Full GC时开启内存碎片的合并整理过程，由于过程无法并发，会导致停顿时间变长，所以虚拟机还提供了另外一个参数-XX:CMSFullGCsBeforeCompaction，用来要求CMS收集器在执行若干次不整理空间的Full GC后，下一次进入Full GC前会先进行碎片整理。

3.5.7 Garbage First收集器

Garbage First（简称G1）开创了收集器面向局部收集的设计思路和基于Region的内存布局形式。

设计者们希望做出一款能够建立起”停顿预测模型“的收集器，停顿预测模型的意思是能够支持指定在一个长度为M毫秒的时间片段内，消耗在垃圾手机上的时间大概率不超过N毫秒这样的目标，这几乎已经是实时Java（RTSJ）的中软实时垃圾收集器特征了。

如何实现这个目标？首先要有思想上的转变，在G1收集器出现之前的所有其他收集器，包括CMS，垃圾收集的目标范围要么是整个新生代，要么是整个老年代，要么是整个Java堆。G1可以面向堆内存任何部分来组成回收集进行回收，衡量标准不再是它属于哪个分代，而是哪块内存中存放的垃圾数量最多，回收收益最大，这就是G1收集器的Mixed GC模式。

G1开创的基于Region的堆内存布局是它能够实现这个目标的关键。G1不再坚持固定大小以及固定数量的分代区域划分，而是把连续的Java堆划分为多个大小相等的独立区域（Region），每一个Region都可以根据角色需要，扮演新生代的Eden空间、Survivor空间，或者老年代空间。收集器能够对扮演不同角色的Region采用不同的策略去处理，这样无论是新对象还是老对象都能获得很好的收集效果。

Region中还有一类特殊的Humongous区，专门用来存储大对象。G1认为只要大小超过了一个Region容量的一半的对象即可判定为大对象。每个Region的大小可以通过参数-XX:G1HeapRegionSize设定，取值范围为1MB~32MB，且应为2的N次幂。对于那些超过了一个Region容量的超级大对象，将会被存放在N个连续的Humongous Region中，G1大多数行为都把Humongous Region作为老年代的一部分来进行看待。

G1收集器之所以能够建立可预测的停顿时间模型，是因为它会跟踪各个Region里面的垃圾堆积的”价值“大小，价值即回收所获得的空间大小以及回收所需时间的经验值，然后在后台维护一个优先级列表，每次根据用户设定允许的收集停顿时间（使用参数-XX:MaxGCPauseMillis指定，默认值是200毫秒）优先处理回收价值收益最大的那些Region，这也是”Garbage First“名字的由来。

G1收集器至少还有以下这些关键的细节问题需要妥善解决：

Region内的跨Region引用如何解决

每个Region都维护自己的记忆集，这些记忆集本质上是一种哈希表，Key是别的Region的起始地址，Value是一个集合，里面存储的元素是卡表的索引号。这种双向的卡表结构更加复杂，因此G1至少要耗费大约Java堆容量的10%至20%的额外内存来维持收集器工作。

并发标记阶段如何保证收集线程和用户线程互不干扰的运行？

CMS是通过增量更新实现的，G1是通过原始快照实现的。G1为每一个Region设计了两个名为TAMS的指针，把Region中的一部分空间划分出来用于并发回收过程中的新对象分配，这两个指针上的对象默认是被隐式标记过的，即默认是存活的，不纳入回收范围。如果内存回收的速度赶不上内存分配的速度，G1收集器也要被迫冻结用户线程执行，导致FullGC并产生长时间线程停顿。

怎样建立起可靠的停顿预测模型

G1会记录每个Region的回收耗时、每个Region记忆集里的脏卡数量等各个可测量的步骤花费的成本，并分析得出平均值、标准偏差、置信度等统计信息。这里强调的”衰减平均值“是指它会比普通的平均值更容易受到新数据影响，平均值代表整体平均状态，但衰减平均值更准确地代表”最近的“平均状态。换句话说，Region的统计状态越新越能决定其回收价值，然后通过这些信息预测现在开始回收的话，由哪些Region组成的回收集才可以在不超过期望停顿时间的约束下获得最高收益。

G1收集器的运作过程大致可划分为以下四个步骤：

初始标记：标记一下GC Roots能直接关联到的对象，并且修改TAMS的值，让下一个阶段用户线程并发运行时，能正确地在可用的Region中分配新对象。这个阶段需要停顿线程，但耗时很短，而且是借用进行Minor GC的时候同步完成的，所以G1收集器在这个阶段实际并没有额外的停顿。
并发标记：进行可达性分析，重新处理SATB（原始快照）记录下的在并发时由引用变动的对象。
最终标记：对用户线程做另一个短暂的暂停，用于处理并发阶段结束后仍遗留下来的最后那少量的SATB记录。
筛选回收：更新Region的统计数据，根据用户期望的停顿时间制定回收计划，可以自由选择任意多个Region构成回收集，必须暂停用户线程，由多条用户线程并行完成。

G1与CMS：

G1优点：可以指定最大停顿时间、分Region的内存布局、按收益动态确定会收集这些创新型设计带来的红利，运作期间不会产生内存空间碎片，有利于程序长时间运行。

G1缺点：卡表实现更复杂，记忆集可能会占整个堆容量的20%甚至更多的内存空间；相比起来CMS的卡表相对简单，而且只需要处理老年代到新生代的应用，反过来则不需要。由于G1的写屏障操作要比CMS占用更多的运算资源，所以G1不得不将其时限为类似消息队列的结构，将写前屏障和写后屏障中要做的事放到队列里，然后再异步处理。

目前在小内存应用上CMS的表现大概率仍然会优于G1，而大内存应用上G1大多能发挥其优势。

六、低延迟垃圾收集器

衡量垃圾收集器的三项重要指标是：内存占用、吞吐量、延迟，三者共同构成了一个“不可能三角”。

硬件规格提升，准确来说是内存的扩大，对延迟反而会带来负面的效果：虚拟机要回收完整的1TB的堆内存，毫无疑问要比回收1GB的堆内存耗费更多时间。

Shenandoah和XGC，几乎整个工作过程全部都是并发的，只有初始标记、最终标记这些阶段有短暂的停顿，这部分停顿的时间基本上都是固定的，与对的容量、队中对象的数量没有正比例关系。

3.6.1 Shenandoah收集器

Shenandoah相较于G1的改进：

支持并发的整理算法
默认不使用分代收集，
摒弃了记忆集，改用名为“连接矩阵”的全局数据结构来记录跨Region的引用关系，也降低了伪共享问题的发生概率。（邻接矩阵）

Shenandoah收集器的工作大致可以划分为以下几个阶段：

初始标记：标记与GC Roots直接关联的对象，仍然需要停顿线程，但停顿时间只与GC Roots的数量有关
并发标记：标记出全部可达的对象，这个阶段可并发执行，时间长短取决于堆中存活对象的数量以及对象图的结构复杂程度
最终标记：处理剩余的SATB（原始快照）扫描，统计出回收价值最高的Region，将这些Region构成一组回收集，这个阶段也会有一小段短暂的停顿
并发清理：清理那些整个区域连一个存活对象都没有的Region（Immediate Garbage Region）
并发回收：这个阶段Shenandoah要把回收集里面的存活对象先复制一份到其他未被使用的Region之中。对于并发回收阶段遇到的指针并发访问问题等，Shenandoah会通过读屏障和被称为“Brooks Pointers”的转发指针来解决。时间长短取决于回收集大小。
初始引用更新：需要把堆中所有指向旧对象的引用修正到复制后的新地址，这个操作称为引用更新。这个阶段只是为了建立一个线程集合点，确保所有并发回收阶段中进行收集线程都已完成分配给他们的对象移动任务而已，会产生一个非常短暂的停顿。
并发引用更新：真正开始进行引用更新操作，这个阶段是并发的，时间长短取决于内存中涉及的引用数量的多少。它只需要按照内存物理地址的顺序，线性的搜索出引用类型，把旧值改为新值即可。
最终引用更新：修正存在于GC Roots中的引用，这个阶段是Shenandoah的最后一次停顿，停顿时间与GC Roots的数量相关。
并发清理：整个回收集中的Region已再无存活对象，最后再调用一次并发清理来回收这些Region的内存空间，供新对象使用。

支持并发整理的核心概念：转发指针

转发指针是在原有对象布局结构的最前面统一增加一个新的引用字段，在正常不处于并发移动的情况下，该引用指向对象自己，当对象有了一个新的副本，便只需要更改转发指针的值指向新的副本即可。Shenandoah收集器使用CAS操作来保证并发时对象的访问正确性。

3.6.2 ZGC收集器

ZGC收集器是一款基于Region内存布局的，不设分代的，使用了读屏障、染色指针和内存多重映射等技术实现的可并发的标记-整理算法的，以低延迟为首要目标的一款垃圾收集器。

ZGC的内存布局：

ZGC可以有大、中、小型Region

小型Region：容量固定为2MB，用于放置小于256KB的小对象
中型Region：容量固定为32MB，用于放置大于等于268KB但小于4MB的对象
大型Region：容量可以动态变化，但必须为2MB的整数倍，用于放置4MB以上的对象。每个大型Region中只会存放一个大对象，最小容量可以低至4MB。

ZGC工作四个阶段：

并发标记：遍历对象图做可达性分析，需要经过短暂停顿，标记阶段会更新染色指针中的Marked 0、Marked 1标志位。
并发预备重分配：根据特定的查询条件统计出来哪些Region需要清理，将这些Region组成重分配集。ZGC每次回收都会扫描所有的Region，用范围更大的扫描成本换取记忆集的维护成本。ZGC的重分配集只是决定了里面的存活对象会被重新复制到其他的Region中，里面的Region会被释放。
并发重分配：这个过程中要把重分配集中的存活对象复制到新的Region上，并为重分配集中的每个Region维护一个转发表，记录从旧对象到新对象的转向关系。得益于染色指针的支持，ZGC收集器能仅从引用上就明确得知一个对象是否处于重分配集之中，如果用户线程此时并发访问了位于重分配集中的对象，这次访问将会被顶置的内存屏障截获，然后根据Region上的转发表记录将访问转发到新复制的对象上，并同时修正更新该引用的值，使其直接指向新对象，ZGC将这种行为称为指针的“自愈”能力。
并发重映射：重映射就是修正整个堆中指向重分配集中旧对象的所有引用。ZGC很巧妙的把重映射要做的工作合并到了下一次并发标记阶段里去完成，反正都是要遍历所有对象的，这样就节省了因此遍历对象图的开销。所有指针都被修正后，原来记录新旧对象关系的转发表就可以被释放掉了。

七、选择合适的垃圾收集器

3.7.1 Epsilon收集器

如果应用只需要运行数分钟甚至数秒，只要Java虚拟机能正确分配内存，在堆耗尽之前就会退出，那显然运行负载极小、没有任何回收行为的Epsilon便是很恰当的选择

3.7.2 收集器的权衡

我们应该如何选择一款适合自己应用的收集器，主要受以下三个因素影响：

应用程序的主要关注点是什么？吞吐量、低延迟、内存占用
运行应用的基础设施？硬件规格、系统架构、处理器的数量、分配内存大小、操作系统
JDK的发行商和版本号，对应的《Java虚拟机规范》的版本

3.7.3 虚拟机及垃圾收集器日志

日志级别从低到高共有六种级别：Trace，Debug，Info，Warning，Error，Off。日志级别决定了输出信息的详细程度，默认级别为Info，HotSpot的日志规则与Log4j、SLF4j类日志框架大体上是一样的

还可以使用修饰器（Decorator）来要求每行日志输出都附加上额外的内容。

3.7.4 垃圾收集器参数总结

八、实战：内存分配与回收策略

之前几个小节已经探讨了如何回收对象的问题，接下来几个小节主要探讨如何分配对象的问题

3.8.1 对象优先在Eden分配

大多数情况下，对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时，虚拟机将发起一次Minor GC

vm参数：-verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+UseSerialGC

private static final int _1MB = 1024 * 1024;
public static void testAllocation(){
    byte[] allocation1 , allocation2 , allocation3 , allocation4;
    allocation1 = new byte[2 * _1MB];
    allocation2 = new byte[2 * _1MB];
    allocation3 = new byte[2 * _1MB];
    allocation4 = new byte[4 * _1MB];  //Minor GC
}

分配allocation4对象时会发生一次Minor GC，原因是Eden已经被占用了6MB，剩余空间已不足以分配allocation4所需的4MB内存，因此发生Minor GC。垃圾收集器期间1虚拟机又发现已有的三个2MB大小的对象全部无法放入Survivor空间，所以只好通过分配担保机制提前转移到老年代去。

3.8.2 大对象直接进入老年代

分配空间时，大对象容易导致内存明明还有不少空间时就提前触发垃圾收集，以获取足够的连续空间才能安置好他们，当复制对象时，大对象意味着高额的内存复制开销。

HotSpot虚拟机提供了-XX:PretenureSizeThreshold参数，指定大于该设置值的对象直接在老年代进行分配，这样做的目的是避免在Eden区及两个Survivor区之间来回复制，产生大量的内存复制操作。

-XX:PretenureSizeThreshold参数只对Serial和ParNew两款新生代收集器有效，HotSpot的其他新生代收集器，如Parallel Scavenge并不支持这个参数。如果必须使用这个参数进行调优，可考虑ParNew加CMS的收集器组合

VM参数：-verbose:gc -Xmx20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:PretenureSizeThreshold=3145728 -XX:UseConcMarkSweepGC

private static final int _1MB = 1024 * 1024;
public static void testAllocation(){
    byte[] allocation;
    allocation = new byte[4 * _1MB];
}

4MB对象直接进入了老年代

3.8.3 长期存活的对象进入老年代

虚拟机给每个对象定义了一个对象年龄计数器，存储在对象头中。对象通常在Eden区诞生，如果经过第一次Minor GC后仍然存活，并且能被Survivor容纳，就将其年龄设为1岁，对象在Survivor中每熬过一次Minor GC，年两就增加1岁，当年龄增加到一定程度（默认为15），就会被晋升到老年代中。

对象晋升老年代的年龄阈值，可以通过参数-XX:MaxTenuringThreshold设置

vm参数：-verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1 -XX:+PrintTenuringDistribution

private static final int _1MB = 1024 * 1024;
    public static void main(String[] args){
        byte[] allocation1 , allocation2 , allocation3;
        allocation2 = new byte[4 * _1MB];
        allocation3 = new byte[4 * _1MB];
        allocation3 = null;
        allocation3 = new byte[4 * _1MB];
    }

MaxTenuringThreshold=15:

3.8.4 动态对象年龄判定

为了能更好地适应不同程序的内存状况，如果在Survivor空间中低于或等于某年龄的所有对象大小的综合大于Survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代

private static final int _1MB = 1024 * 1024;
    public static void main(String[] args){
        byte[] allocation1 , allocation2 , allocation3 , allocation4;
        allocation1 = new byte[_1MB / 4];
        allocation2 = new byte[_1MB / 4];
        allocation3 = new byte[4 * _1MB];
        allocation4 = new byte[4 * _1MB];
        allocation4 = null;
        allocation4 = new byte[4 * _1MB];
    }

3.8.5 空间分配担保

进行Minor GC之前，虚拟机必须先检查老年代是否有足够空间进行分配担保和-XX:HandlePromotionFailure参数，如果老年代没有足够空间并且参数设置不允许冒险，那么这时就要改为一次FullGC

你可能感兴趣的:(jvm,算法,jvm,java,java-ee,学习)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟