Java多线程问题大揭秘:从底层原理到解决方案

yumo66613小时前技术文章3

并发编程为什么会出问题?

现代计算机为了提高计算机的整体能力,操作系统做出了以下努力:

  • CPU增加了缓存

CPU对于数据的计算速度远远高于从内存中存取数据的速度,为了缓和CPU与内存之间的速度差异,计算机的制造商为CPU增加了缓存

  • 操作系统增加了进程和线程

为了解决单任务执行的效率瓶颈,提升系统资源管理和并发能力,操作系统引入的进程和线程

  • 优化CPU指令执行顺序

我们写的并发程序在操作系统上运行时,对于CPU缓存的使用可能会不太合理,造成CPU缓存的浪费,为了使CPU的缓存能够得到更加合理的利用,编译程序对CPU上指令的执行顺序进行了优化


那么,这样做会有什么问题呢?我们以java语言来阐述一下,先来看看java的内存模型

Java内存模型规定了所有的变量都存储在主内存(物理内存)中,每条线程还有自己的工作内存,线程对变量的所有操作都必须在工作内存中进行。不同的线程无法访问其他线程的工作内存里的内容。


  • 缓存(java线程的工作内存)带来的可见性问题

在这个例子中,即使线程2将flag设为false,线程1可能仍然看不到这个变化,导致无限循环。这是因为flag变量没有被正确同步,线程1可能一直读取的是自己工作内存中的缓存值。


  • 线程切换带来的原子性问题

这个例子计算结果并不是期望的20000。count++大致可以分成三步CPU指令:

指令1:把变量count从内存加载的CPU寄存器。

指令2:在寄存器中执行count++操作。

指令3:将结果写入缓存(可能是CPU缓存,也可能是内存)

线程t1将count=0加载到CPU的寄存器后,假如此时发生了线程切换。此时内存中的count值仍然为0,线程t2将count=0加载到寄存器,执行count++操作,并将count=1写到内存。此时假如CPU切换到线程t1,执行线程t1中的count++操作后,线程t1中的count值为1,线程t1将count=1写入内存,此时内存中的count值最终为1,而不是期望的2。所以,如果在CPU中存在正在执行的线程,恰好此时CPU发生了线程切换,则可能会导致原子性问题,这也是导致并发编程频繁出问题的根源之一。

  • 指令重排带来的有序性问题

在Java程序中,一个经典的案例就是使用双重检查机制来创建单例对象。例如,在下面的代码中,在getInstance()方法中获取对象实例时,首先判断instance对象是否为空,如果为空,则锁定当前类的class对象,并再次检查instance是否为空,如果instance对象仍然为空,则为instance对象创建一个实例

对于上面的instance=new SingletonDemo代码来说,会有3个CPU指令与其对应。

  • 分配内存空间。
  • 初始化对象。
  • 将instance引用指向内存空间。

正常执行的CPU指令顺序为1—>2—>3,CPU对程序进行重排序后的执行顺序可能为1—>3—>2。在多线程获取单例时,就会出现问题。

线程B获得了未初始化完成的对象。


Java如何解决多线程三大难题?

可见性问题的解决方案是volatile关键字。它就像给变量加了实时同步功能,任何修改都会立即刷新到主内存,并让其他线程的工作内存失效。


原子性问题需要synchronized原子类。synchronized像给代码段加锁,确保同一时间只有一个线程执行。原子类如AtomicInteger则利用CAS(Compare-And-Swap)机制实现无锁线程安全。


指令重排问题通过内存屏障解决。volatile和synchronized都会插入特定屏障,阻止某些重排序。

JAVA内存模型规范

java内存模型是一个非常复杂的规范,Java内存模型中引入了Happens-Before原则来保证多线程环境下操作之间的可见性顺序性,确保程序执行的正确性。

Happens-Before原则:


  • 【原则一】程序次序规则

在一个线程中,按照代码的顺序,前面的操作Happens-Before于后面的任意操作,这个规则比较符合单线程的思维:在同一个线程中,程序在前面对某个变量的修改一定是对后续操作可见的。

  • 【原则二】volatile变量规则

对一个volatile变量的写操作,Happens-Before于后续对这个变量的读操作

  • 【原则三】传递规则

如果A Happens-Before B,并且B Happens-Before C,则A Happens-Before C

  • 【原则四】锁定规则

对一个锁的解锁操作 Happens-Before于后续对这个锁的加锁操作

在进入synchronized代码块之前,会自动加锁,在代码块执行完毕后,会自动释放锁,假设有这样一段程序运行在syncgronized代码块中将变量x的值,假如有线程A获取到锁执行完synchronized代码块之后将x变量的值修改为10,并释放synchronized锁。当线程B进入synchronized代码块时,能够获取到线程A对x变量的写操作,也就是说,线程B访问到的x变量的值为10。

  • 【原则五】线程启动规则

如果线程A调用了线程B的start()方法来启动线程,则start()操作Happens-Before于线程B中的任意操作

  • 【原则六】线程终止规则

线程A等待线程B的完成(在线程A中调用了线程B的join方法),线程B完成后,线程A可以看到线程B对共享变量的修改

  • 【原则七】线程中断规则

对线程interrupt()方法的调用Happens-Before于被中断线程的代码检测到中断事件的发生

例如

上面的程序代码。在主线程中中断线程B之前,将共享变量x的值修改为100,则当线程B检测到中断事件时,访问到的x变量的值为100

  • 【原则八】对象终止规则

一个对象的初始化完成Happens-Before于它的finalize()方法的开始


Happens-Before规则的核心作用

  • 可见性保障:若操作A happens-before操作B,则A对共享变量的修改对B可见2
  • 禁止重排序:编译器/处理器需遵守规则顺序,避免破坏语义的重排序。
  • 跨线程同步:通过锁、volatile等机制建立线程间操作顺序约束


Happens-Before规则底层实现:

主要依靠内存屏障指令:

  • 硬件级屏障 CPU指令集提供的内存屏障指令
  • 禁止屏障前后的指令重排,
  • 强制刷新缓存,写操作后强制刷新到主内存,读操作前清空本地缓存

volatile特性

volatile关键字在Java中提供了两大核心保证:

  • 可见性保证:对volatile变量的修改立即对所有线程可见
  • 有序性保证:禁止指令重排序

volatitle实现机制:

操作类型

插入的屏障指令

作用说明

volatile写

StoreStore + StoreLoad

强制刷新到主内存并确保后续读可见

volatile读

LoadLoad + LoadStore

防止当前读操作与后续操作重排序

volatile写操作底层伪指令

mov [flag], 1 ; 写操作

sfence ; StoreStore屏障 - 保证普通写完成

mfence ; StoreLoad屏障 - 刷新到主内存并阻塞后续读


volatile读操作底层伪指令

lfence ; LoadLoad屏障 - 阻塞后续读直到完成

mov eax, [flag] ; 读操作

lfence ; LoadStore屏障 - 阻止读后操作重排序

使用注意事项

volatile不保证复合操作原子性

如:

volatile int count = 0;

count++; // 非原子操作,需要synchronized或AtomicInteger

count++实际包含3个非原子步骤:

1. 读取count值到寄存器

2. 寄存器值+1

3. 写回主内存

volatile的内存屏障只能保证可见性和有序性,无法阻止多个线程同时进入临界区,当多线程并发执行时,可能出现两个线程同时读取到相同初始值,导致最终结果少加


建议使用场景:

仅当需要跨线程可见性时使用volatile

1,状态标志位(最常用)

适用于需要跨线程通信的简单状态控制,如线程启停控制

public class TaskController {

private volatile boolean running = true;

public void stop() {

running = false; // 修改立即对所有线程可见

}

public void execute() {

while (running) { // 安全读取最新状态

// 执行任务

}

}

}

2,双重检查锁定(DCL单例模式)

上文有使用示例

synchronized的深度解析

synchronized是Java实现线程同步的核心机制,通过内置的监视器锁(Monitor)保证代码块或方法的原子性、可见性和有序性。其核心特性包括:

  • 原子性:确保同一时刻只有一个线程能执行同步代码块
  • 可见性:线程释放锁前会将共享变量刷新到主内存
  • 有序性:防止编译器和处理器对同步代码块内的指令重排序


三种基本使用方法:

1. 实例方法同步(锁当前对象实例)

public synchronized void method() {...}

2. 静态方法同步(锁Class对象)

public static synchronized void staticMethod() {...}

3. 同步代码块(锁指定对象)

public void blockMethod() {

synchronized(lockObj) {...}

}


synchronized实现原理:

synchronized 修饰的代码块编译为 monitorenter 和 monitorexit 指令

监视器(Monitor)是 Java 中实现线程同步的底层机制,每个 Java 对象都可关联一个 Monitor,每个 Monitor 包含三个关键队列:

  • Owner:持有锁的线程指针(初始为 null)
  • EntryList:竞争锁失败的阻塞线程队列(BLOCKED 状态)
  • WaitSet:调用 wait() 后进入等待的线程队列(WAITING 状态)

锁竞争流程:

线程执行monitorenter指令时尝试获取monitor的 所有权,过程如下:

如果monitor的进入数为0,则该线程进入monitor成为Owner,然后将进入数设置为1,如果该线程已经是Owner,只是重新进入,进入数加1,如果其它线程已经是monitor的Owner,则该线程进入EntryList阻塞。直到monitor的进入数为0,再重新尝试获取monitor的所有权


执行monitorexit的线程必须是monitor的Owner

指令执行时,monitor的进入数减1,如果减1后进入数为0,则释放锁,唤醒 EntryList 线程非公平竞争。


这里顺便提一下,其实wait/notify等方法也依赖于monitor对象,这就是为什么只有在同步的块或者方法中才能调用wait/notify/notifyAll等方法,否则会抛出
java.lang.IllegalMonitorStateException的异常的原因。

线程协作

  • 线程调用 wait() 释放锁并进入 WaitSet;
  • 其他线程调用 notify() 将 WaitSet 线程移回 EntryList


注意:jdk1.6后,synchronized的实现经历了多次优化升级,即锁升级

无锁 → 偏向锁 → 轻量级锁 → 重量级锁(关联 Monitor)

后续专门写文章细说

相关文章

Synchronized的实现原理详解(看这篇就够了)

谈到多线程就不得不谈到Synchronized,重要性不言而喻,今天主要谈谈Synchronized的实现原理。Synchronizedsynchronized关键字解决的是多个线程之间访问资源的同步...

探讨C语言系统编程中线程的原理以及实现

点击蓝字 关注我们线程的概念我们今天来聊一聊线程,之前有写过一篇关于进程的文章,今天我们聊的线程,和进程差不多,我们首先要知道的一件事情是一个进程里面可以包括多个线程,不能反过来,我们之前了解到的不同...

解析C#中的多线程编程机制:Thread、ThreadPool、Task和Parallel

Thread、ThreadPool、Task和Parallel是C#中用于多线程编程和并行处理的不同机制。每个机制都有自己的原理和使用方式。可以根据需求选择适当的机制来实现并发性和并行性,并结合示例进...

彻底了解线程池的原理——40行从零开始自己写线程池

前言在我们的日常的编程当中,并发是始终离不开的主题,而在并发多线程当中,线程池又是一个不可规避的问题。多线程可以提高我们并发程序的效率,可以让我们不去频繁的申请和释放线程,这是一个很大的花销,而在线程...

Redis不是号称单线程效率也很高吗,为什么又采用多线程了?

Redis是目前广为人知的一个内存数据库,在各个场景中都有着非常丰富的应用,前段时间Redis推出了6.0的版本,在新版本中采用了多线程模型。因为我们公司使用的内存数据库是自研的,按理说我对Redis...