伪共享和Java缓存行-伙伴云

伪共享和Java 缓存行

网友投稿 945 2022-05-29

对于多线程编程来说，一般要注意线程安全的问题，如果是要实现超高并发的中间件，特别是需要多线程处理列表、数组和队列的时候，就需要注意伪共享的问题。否则可能无法发挥多线程的优势，性能可能比单线程还差。

伪共享

介绍伪共享前先说说 SMP、Cache、MESI 几个概念。

SMP 系统

操作系统主要分下面两种：

SMP——Symmetric Multi-Processing (SMP)，即对称多处理器结构

AMP——Asymmetric Multi-Processing (AMP) ，非对称多处理器结构

SMP的特征是：只有一个操作系统实例，运行在多个CPU上，每个CPU的结构都是一样的，内存、资源共享。这种系统有一个最大的特点就是共享所有资源。

AMP的特征是：多个CPU，各个CPU在架构上不一样，每个CPU内核运行一个独立的操作系统或同一操作系统的独立实例，每个CPU拥有自己的独立资源。这种结构最大的特点在于不共享资源。

我们平时使用的机器基本都是 SMP 系统。

Cache

CPU 和主内存之间的运算速度是差异巨大的，在现今的 SMP 系统中，会在 CPU 和主存间设置三级高速缓存，L1、L2 和 L3，读取顺序由先到后。可以简单理解为，L1 Cache分为指令缓存和数据缓存两种，L2 Cache只存储数据，L1 和 L2 都是每个核心都有，而 L3 被多核共享。

缓存系统中是以缓存行（cache line）为单位存储的。缓存行是2的整数幂个连续字节，一般为32-256个字节。最常见的缓存行大小是64个字节。

MESI

MESI 是一致性协议，研究过 Java volatile 可能会比较熟悉，因为L1 L2是每个核心自己使用，而L3一般是多核共享，而不同核心又可能涉及共享变量问题，所以各个高速缓存间势必会有一致性的问题。MESI就是解决这些问题的一种协议或规范。

下面是关于 MESI 的一段说明：

在MESI协议中，每个Cache line有4个状态，可用2个bit表示，它们分别是:

M(Modified)：这行数据有效，数据被修改了，和内存中的数据不一致，数据只存在于本Cache中；

E(Exclusive)：这行数据有效，数据和内存中的数据一致，数据只存在于本Cache中；

S(Shared)：这行数据有效，数据和内存中的数据一致，数据存在于很多Cache中；

I(Invalid)：这行数据无效。

什么是伪共享

伪共享和Java缓存行

到现在什么是伪共享，为什么它会影响到性能呢？先看一个图:

从图中可看到，thread0,thread1 分别由 core0，core1 调度，两线程都想更新彼此独立的两个变量，但是由于两个变量位于同一个cache line中，根据MESI cache line 的状态应该都是 Shared，而对于同一 cache line 的操作，core 间必须争夺主导权（ownership），如果 core0 抢到了，thread0 因此去更新cache line，会导致core1中的 cache line 状态变为 Invalid，随后 thread1 去更新时必须通知 core0 将 cache line 刷回主存，然后它再从主内存中 load 该 cache line 进高速缓存之后再进行修改，但该修改又会使得 core0 的 cache line 失效，thread0 重复上演 thread1 历史，这样导致了高速缓存并未起到应有的作用，反而影响了性能。

这就是对称多处理器（SMP）系统中一个著名的性能问题：伪共享。

Java 缓存行

对于出现伪共享的问题，根据上文介绍出现的原因，我们可以采用填充的方式来保证某个热点对象被隔离在不同的缓存行中，从而避免了多线程互相抢同一个 cache line，这样性能也就不会造成影响。

Java 8 方案

Java的各个版本在减少伪共享的做法都有区别，Java 8 以前的版本可以采用填充的方案，这里只具体介绍 Java 8 的实现方案。

JAVA 8中添加了一个 @Contended 的注解，对某字段加上该注解则表示该字段会单独占用一个缓存行（Cache Line）。

举个例子：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

public final class FalseSharing implements Runnable { public static int NUM_THREADS = 4; public final static long ITERATIONS = 500L * 1000L * 1000L; private final int arrayIndex; private static VolatileLong[] longs; public FalseSharing(final int arrayIndex) { this.arrayIndex = arrayIndex; } @Override public void run() { long i = ITERATIONS + 1; while (0 != --i) { longs[arrayIndex].value = i; } } public static void main(final String[] args) throws Exception { System.out.println("starting...."); longs = new VolatileLong[NUM_THREADS]; for (int i = 0; i < longs.length; i++) { longs[i] = new VolatileLong(); } final long start = System.nanoTime(); runTest(); System.out.println("duration = " + (System.nanoTime() - start)); } private static void runTest() throws InterruptedException { Thread[] threads = new Thread[NUM_THREADS]; for (int i = 0; i < threads.length; i++) { threads[i] = new Thread(new FalseSharing(i)); } for (Thread t : threads) { t.start(); } for (Thread t : threads) { t.join(); } } }

1 2 3 4

@Contended public class VolatileLong { public volatile long value = 0L; }

这个例子是两个线程同时对同一个数组进写操作，见 runTest 函数和 FalseSharing 类的 run 函数。VolatileLong 类的 value 被 volatile 修饰，

在 run 函数中没有线程安全的问题。

测试情况：

当在 VolatileLong 类上加了 @Contended 注解时，输出：

duration = 3581736100

当把 VolatileLong 类上的 @Contended 注解删除时，输出：

duration = 20545682900

可以看到，不加@Contended 注解时，所消耗的时间大概是加 @Contended 注解时的5倍。

注意 @Contended 注解要生效，需要加上虚拟机参数 -XX:-RestrictContended。

对于伪共享的问题呢，解决方案本质上就是填充，某种程度就是以空间换时间，这值得我们去思考。

伪共享的问题是程序性能的问题，虽然很重要，但优先级不要拔高，不要过早优化。

Java

九江博雅高级中学高三复读班招生简章核心信息解读（2024 年秋季招生政策，供 2025 届复读生参考）

945 2022-05-29

OKR是目标管理吗？一探究竟及其实施策略">OKR是目标管理吗？一探究竟及其实施策略

945 2022-05-29

Java的面向对象编程">Java的面向对象编程

945 2022-05-29

伪共享和Java 缓存行

九江博雅高级中学高三复读班招生简章核心信息解读（2024 年秋季招生政策，供 2025 届复读生参考）

OKR是目标管理吗？一探究竟及其实施策略">OKR是目标管理吗？一探究竟及其实施策略

Java的面向对象编程">Java的面向对象编程

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接

伪共享和Java缓存行

微信扫一扫：分享

OKR是目标管理吗？一探究竟及其实施策略">OKR是目标管理吗？一探究竟及其实施策略

Java的面向对象编程">Java的面向对象编程

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接

伪共享和Java 缓存行