线程同步:synchronized及其原理
线程竞争问题
多个线程同时共享并操作同一个数据,就会发生线程竞争。就有可能引发线程安全问题;下面是经典的银行取钱问题:
结果:
导致线程安全问题的根本原因主要是以下两点:
线程是并发执行的,CPU会在多个线程之前来回切换。即有线程竞争
CPU所执行的代码指令是多个,不是 原子 的。 比如 判断余额、扣减余额、显示余额三个就是三条CPU指令,执行完一个指令后,有可能执行其他线程的有关指令,导致资源混乱。
所以避免线程竞争是解决线程安全问题的一种解决方案
锁的概念
线程安全问题即是 并发安全 问题,无论是并发安全问题还是并行安全问题,都可以使用锁来解决。锁的办法比较直观,只要保证余额判断、扣减金额、显示金额针对统一资源处于同一 原子操作,即是线程独占的。
所谓的锁就是在多个线程共同可访问的空间中放置一个标记,假设资源A的锁为: res_lock
,当 res_lock=0
时代表资源A未被任何线程访问,而 res_lock=1
时代表资源A已被某个线程访问。
假设Thread1 与 Thread2 共同访问资源A,ThreadA被CPU先选中,开始执行逻辑代码: 判断余额-扣减金额-查询余额
。Thread1发现 res_lock=0
说明没有其他线程正在访问此资源,Thread1 将 res_lock
置为1——这个过程称为加锁;然后开始执行逻辑。此时Thread2被CPU选中,Thread1发现 res_lock=1
,他将不会继续执行(会阻塞或者直接返回)——此过程称为加锁失败;此时Thread1再次被CPU选中,继续执行业务逻辑;执行结束后,Thread1将 res_lock
重新置为0——这个过程称为所释放。此时阻塞中的Thread2发现 res_lock=0
,Thread2将会重复Thread1之前的逻辑。
在这个过程中,即使Thread1的操作被CPU打断,但是由于 res_lock
标记,其他线程无法执行业务代码,从而保证了Thread1的业务代码的原子性,从而保证了线程安全。
无论是 synchronized 还是 Lock,还是Redis、Zookeeper分布式锁,实现的方式原理都是上述描述的锁的原理。
synchronized
synchronized 关键字可以给一段代码加锁,既保证了原子性,也保证了可见性。并且是一个可重入锁。
除此之外,synchronized有以下几个变种:
同步方法:
静态同步方法:
注意:
锁对象一般为final类型,保证引用不可变;如果引用发生变化,就锁不住了
锁对象不能为null,否则会抛出空指针异常
String、Integer等对象最好不要做为锁,因为String、Integer(0-127)位于常量池中,如果其他jar包中的资源也对同值的String进行了锁定,那么将会出现不可预知的问题。
锁释放
以下情况会进行锁释放:
代码块执行完毕
同步方法执行完毕
代码块、方法抛出异常
wait,会释放当前的锁对象
以下情况不会进行锁释放:
sleep
yield
wait、notify、notifyAll
wait方法用在synchronized代码块内,当调用wait方法时,将会释放当前的锁,并让当前线程进入等待状态,这些等待的线程会进入该锁对象的等待池中。
notify方法将会在等待池中,随机换醒一个等待的线程,将其加入到锁池中。锁池中的所有对象会竞争锁。
notifyAll方法将会唤醒所有的等待线程,将他们全都加入到锁池中。
锁原理
了解 synchronized 的实现原理,首先要知道Java对象头的概念。Java对象是存储在堆内存中,一个对象可以大致分为三个部分:
对象头: 主要由MarkWord和Klass Point(类型指针)组成。
MarkWord部分用于存储自身运行时的数据,比如表示对象的线程锁状态、存放该对象的hashCode、配合GC等功能
Klass Point是一个指向方法区中Class信息的指针,通过这个指针随时可以知道此对象的类型
如果对象是数组对象,那么就会在第三个位置上记录数组的长度
对象体:是用于存储对象属性和值的主体部分,占用空间的大小取决于对象属性的数量和类型
填充字符:因为虚拟机要求对象字节必须是8字节的整数倍,填充字符就是用于凑齐这个整数倍的
既然synchronized存储在MarkWord对象头中,那么我们来看一下MarkWord在不同的锁状态下,组成的不同表现(64位虚拟机):
首先,这五种状态 —— 正常、偏向锁、轻量级锁、重量级锁、GC标记,分别由64bit中的最后2bit表示,他们分别对应一个数值,具体如下:
状态标志位存储内容正常01,内部还是用based_lock来标记是否是偏向锁hashCode(identity_hashcode)、对象分代年龄偏向锁01,内部还是用based_lock来标记是否是偏向锁偏向线程ID、偏向时间戳、对象分代年龄轻量级锁定00指向锁记录的指针重量级锁10指向重量级锁的指针GC标记11无任何信息,马上就被回收了
biased_lock: 对象是否启用偏向锁标记, 1bit, 1表示启用了偏向锁,0表示未启用偏向锁
age: 4bit,Java对象的年龄,如果对象在Survivor区复制一次,年龄增加1,到达阈值时,会晋升到老年代
identity_hashcode: 31bit,hashCode值。对象的hashCode值将会调用System.identityHashCode()计算,然后写入到对象头中。当对象加锁后(偏向、轻量级、重量级),MarkWord的字节没有足够的空间保存hashCode,因此该值会移动到管程Monitor中
thread: 偏向锁所偏向的线程ID
epoch: 偏向锁的时间戳
ptr_to_lock_record:轻量级锁状态下,指向栈中锁记录的指针
ptr_to_heavyweight_monitor:重量级锁状态下,指向对象监视器Monitor的指针
锁升级
在JVM虚拟机规范中,针对synchronized的实现并没有任何规定。早期的实现中,每次加锁都去操作系统申请,是重量级的。因为每次都去操作系统申请,导致synchronzied效率非常低,在JDK1.5之后,采取了锁升级,简单可以理解为先使用轻量级的方式,如果有需要则升级为重量级的方式。以Hotspot为例,锁升级大概经历了以下几个阶段:
无锁: 没有任何线程竞争,MarkWord状态处于正常状态,lock状态为01, biased_lock偏向锁状态为0
偏向锁 (偏向某一线程 ):当有一个线程来竞争锁时,先使用偏向锁,表示对象偏爱这个线程。这个线程在执行这个锁关联的任何代码,不需要进行任何检查和切换,在竞争不激烈的情况下,效率非常高。
自旋锁(循环10次):当有第二个线程去竞争这个锁对象,就不可以使用独占锁了,锁会自动升级为轻量级锁。谁先抢到锁谁就拥有执行权。轻量级锁内部是一个循环,他会不断的去获取锁,直到获取到为止。
重量级锁:即OS锁,如果竞争这个锁的线程太多,或者等待的时间过长,内部的循环会导致CPU负载过高,所以锁会自动升级为OS锁,也就是同步锁,此时MarkWord的状态最终会变为10,并指向监视器对象。
注意,锁升级后是无法降级的。
执行时间(加锁代码)较长,线程数较多的使用OS锁,短的线程少的适合自旋锁
参考资源
最后更新于
这有帮助吗?