歡迎光臨
每天分享高質量文章

死磕 Java 併發:深入分析 synchronized 的實現原理

(點選上方公眾號,可快速關註)


來源:cmsblogs ,

cmsblogs.com/?p=2071

記得剛剛開始學習Java的時候,一遇到多執行緒情況就是synchronized,相對於當時的我們來說synchronized是這麼的神奇而又強大,那個時候我們賦予它一個名字“同步”,也成為了我們解決多執行緒情況的百試不爽的良藥。但是,隨著我們學習的進行我們知道synchronized是一個重量級鎖,相對於Lock,它會顯得那麼笨重,以至於我們認為它不是那麼的高效而慢慢摒棄它。

誠然,隨著Javs SE 1.6對synchronized進行的各種最佳化後,synchronized並不會顯得那麼重了。下麵跟隨LZ一起來探索synchronized的實現機制、Java是如何對它進行了最佳化、鎖最佳化機制、鎖的儲存結構和升級過程;

實現原理

synchronized可以保證方法或者程式碼塊在執行時,同一時刻只有一個方法可以進入到臨界區,同時它還可以保證共享變數的記憶體可見性

Java中每一個物件都可以作為鎖,這是synchronized實現同步的基礎:

  1. 普通同步方法,鎖是當前實體物件

  2. 靜態同步方法,鎖是當前類的class物件

  3. 同步方法塊,鎖是括號裡面的物件

當一個執行緒訪問同步程式碼塊時,它首先是需要得到鎖才能執行同步程式碼,當退出或者丟擲異常時必須要釋放鎖,那麼它是如何來實現這個機制的呢?我們先看一段簡單的程式碼:

public class SynchronizedTest {

    public synchronized void test1(){

 

    }

 

    public void test2(){

        synchronized (this){

 

        }

    }

}

利用javap工具檢視生成的class檔案資訊來分析Synchronize的實現


從上面可以看出,同步程式碼塊是使用monitorenter和monitorexit指令實現的,同步方法(在這看不出來需要看JVM底層實現)依靠的是方法修飾符上的ACC_SYNCHRONIZED實現。

同步程式碼塊:monitorenter指令插入到同步程式碼塊的開始位置,monitorexit指令插入到同步程式碼塊的結束位置,JVM需要保證每一個monitorenter都有一個monitorexit與之相對應。任何物件都有一個monitor與之相關聯,當且一個monitor被持有之後,他將處於鎖定狀態。執行緒執行到monitorenter指令時,將會嘗試獲取物件所對應的monitor所有權,即嘗試獲取物件的鎖;

同步方法:synchronized方法則會被翻譯成普通的方法呼叫和傳回指令如:invokevirtual、areturn指令,在VM位元組碼層面並沒有任何特別的指令來實現被synchronized修飾的方法,而是在Class檔案的方法表中將該方法的access_flags欄位中的synchronized標誌位置1,表示該方法是同步方法並使用呼叫該方法的物件或該方法所屬的Class在JVM的內部物件表示Klass做為鎖物件。(摘自:http://www.cnblogs.com/javaminer/p/3889023.html)

下麵我們來繼續分析,但是在深入之前我們需要瞭解兩個重要的概念:Java物件頭,Monitor。

Java物件頭、monitor

Java物件頭和monitor是實現synchronized的基礎!下麵就這兩個概念來做詳細介紹。

Java物件頭

synchronized用的鎖是存在Java物件頭裡的,那麼什麼是Java物件頭呢?Hotspot虛擬機器的物件頭主要包括兩部分資料:Mark Word(標記欄位)、Klass Pointer(型別指標)。其中Klass Point是是物件指向它的類元資料的指標,虛擬機器透過這個指標來確定這個物件是哪個類的實體,Mark Word用於儲存物件自身的執行時資料,它是實現輕量級鎖和偏向鎖的關鍵,所以下麵將重點闡述

Mark Word。

Mark Word用於儲存物件自身的執行時資料,如雜湊碼(HashCode)、GC分代年齡、鎖狀態標誌、執行緒持有的鎖、偏向執行緒 ID、偏向時間戳等等。Java物件頭一般佔有兩個機器碼(在32位虛擬機器中,1個機器碼等於4位元組,也就是32bit),但是如果物件是陣列型別,則需要三個機器碼,因為JVM虛擬機器可以透過Java物件的元資料資訊確定Java物件的大小,但是無法從陣列的元資料來確認陣列的大小,所以用一塊來記錄陣列長度。下圖是Java物件頭的儲存結構(32位虛擬機器):


物件頭資訊是與物件自身定義的資料無關的額外儲存成本,但是考慮到虛擬機器的空間效率,Mark Word被設計成一個非固定的資料結構以便在極小的空間記憶體儲存儘量多的資料,它會根據物件的狀態復用自己的儲存空間,也就是說,Mark Word會隨著程式的執行發生變化,變化狀態如下(32位虛擬機器):


簡單介紹了Java物件頭,我們下麵再看Monitor。

Monitor

什麼是Monitor?我們可以把它理解為一個同步工具,也可以描述為一種同步機制,它通常被描述為一個物件。

與一切皆物件一樣,所有的Java物件是天生的Monitor,每一個Java物件都有成為Monitor的潛質,因為在Java的設計中 ,每一個Java物件自打孃胎裡出來就帶了一把看不見的鎖,它叫做內部鎖或者Monitor鎖。

Monitor 是執行緒私有的資料結構,每一個執行緒都有一個可用monitor record串列,同時還有一個全域性的可用串列。每一個被鎖住的物件都會和一個monitor關聯(物件頭的MarkWord中的LockWord指向monitor的起始地址),同時monitor中有一個Owner欄位存放擁有該鎖的執行緒的唯一標識,表示該鎖被這個執行緒佔用。其結構如下:


  • Owner:初始時為NULL表示當前沒有任何執行緒擁有該monitor record,當執行緒成功擁有該鎖後儲存執行緒唯一標識,當鎖被釋放時又設定為NULL;

  • EntryQ:關聯一個系統互斥鎖(semaphore),阻塞所有試圖鎖住monitor record失敗的執行緒。

  • RcThis:表示blocked或waiting在該monitor record上的所有執行緒的個數。

  • Nest:用來實現重入鎖的計數。

  • HashCode:儲存從物件頭複製過來的HashCode值(可能還包含GC age)。

  • Candidate:用來避免不必要的阻塞或等待執行緒喚醒,因為每一次只有一個執行緒能夠成功擁有鎖,如果每次前一個釋放鎖的執行緒喚醒所有正在阻塞或等待的執行緒,會引起不必要的背景關係切換(從阻塞到就緒然後因為競爭鎖失敗又被阻塞)從而導致效能嚴重下降。Candidate只有兩種可能的值0表示沒有需要喚醒的執行緒1表示要喚醒一個繼任執行緒來競爭鎖。

摘自:Java中synchronized的實現原理與應用。

我們知道synchronized是重量級鎖,效率不怎麼滴,同時這個觀念也一直存在我們腦海裡,不過在jdk 1.6中對synchronize的實現進行了各種最佳化,使得它顯得不是那麼重了,那麼JVM採用了那些最佳化手段呢?

鎖最佳化

jdk1.6對鎖的實現引入了大量的最佳化,如自旋鎖、適應性自旋鎖、鎖消除、鎖粗化、偏向鎖、輕量級鎖等技術來減少鎖操作的開銷。

鎖主要存在四中狀態,依次是:無鎖狀態、偏向鎖狀態、輕量級鎖狀態、重量級鎖狀態,他們會隨著競爭的激烈而逐漸升級。註意鎖可以升級不可降級,這種策略是為了提高獲得鎖和釋放鎖的效率。

自旋鎖

執行緒的阻塞和喚醒需要CPU從使用者態轉為核心態,頻繁的阻塞和喚醒對CPU來說是一件負擔很重的工作,勢必會給系統的併發效能帶來很大的壓力。同時我們發現在許多應用上面,物件鎖的鎖狀態只會持續很短一段時間,為了這一段很短的時間頻繁地阻塞和喚醒執行緒是非常不值得的。所以引入自旋鎖。

何謂自旋鎖?

所謂自旋鎖,就是讓該執行緒等待一段時間,不會被立即掛起,看持有鎖的執行緒是否會很快釋放鎖。怎麼等待呢?執行一段無意義的迴圈即可(自旋)。

自旋等待不能替代阻塞,先不說對處理器數量的要求(多核,貌似現在沒有單核的處理器了),雖然它可以避免執行緒切換帶來的開銷,但是它佔用了處理器的時間。如果持有鎖的執行緒很快就釋放了鎖,那麼自旋的效率就非常好,反之,自旋的執行緒就會白白消耗掉處理的資源,它不會做任何有意義的工作,典型的佔著茅坑不拉屎,這樣反而會帶來效能上的浪費。所以說,自旋等待的時間(自旋的次數)必須要有一個限度,如果自旋超過了定義的時間仍然沒有獲取到鎖,則應該被掛起。

自旋鎖在JDK 1.4.2中引入,預設關閉,但是可以使用-XX:+UseSpinning開開啟,在JDK1.6中預設開啟。同時自旋的預設次數為10次,可以透過引數-XX:PreBlockSpin來調整;

如果透過引數-XX:preBlockSpin來調整自旋鎖的自旋次數,會帶來諸多不便。假如我將引數調整為10,但是系統很多執行緒都是等你剛剛退出的時候就釋放了鎖(假如你多自旋一兩次就可以獲取鎖),你是不是很尷尬。於是JDK1.6引入自適應的自旋鎖,讓虛擬機器會變得越來越聰明。

適應自旋鎖

JDK 1.6引入了更加聰明的自旋鎖,即自適應自旋鎖。所謂自適應就意味著自旋的次數不再是固定的,它是由前一次在同一個鎖上的自旋時間及鎖的擁有者的狀態來決定。它怎麼做呢?執行緒如果自旋成功了,那麼下次自旋的次數會更加多,因為虛擬機器認為既然上次成功了,那麼此次自旋也很有可能會再次成功,那麼它就會允許自旋等待持續的次數更多。反之,如果對於某個鎖,很少有自旋能夠成功的,那麼在以後要或者這個鎖的時候自旋的次數會減少甚至省略掉自旋過程,以免浪費處理器資源。

有了自適應自旋鎖,隨著程式執行和效能監控資訊的不斷完善,虛擬機器對程式鎖的狀況預測會越來越準確,虛擬機器會變得越來越聰明。

鎖消除

為了保證資料的完整性,我們在進行操作時需要對這部分操作進行同步控制,但是在有些情況下,JVM檢測到不可能存在共享資料競爭,這是JVM會對這些同步鎖進行鎖消除。鎖消除的依據是逃逸分析的資料支援。

如果不存在競爭,為什麼還需要加鎖呢?所以鎖消除可以節省毫無意義的請求鎖的時間。變數是否逃逸,對於虛擬機器來說需要使用資料流分析來確定,但是對於我們程式員來說這還不清楚麼?我們會在明明知道不存在資料競爭的程式碼塊前加上同步嗎?但是有時候程式並不是我們所想的那樣?我們雖然沒有顯示使用鎖,但是我們在使用一些JDK的內建API時,如StringBuffer、Vector、HashTable等,這個時候會存在隱形的加鎖操作。比如StringBuffer的append()方法,Vector的add()方法:

public void vectorTest(){

     Vector vector = new Vector();

     for(int i = 0 ; i < 10 ; i++){

         vector.add(i + “”);

     }

 

     System.out.println(vector);

 }

在執行這段程式碼時,JVM可以明顯檢測到變數vector沒有逃逸出方法vectorTest()之外,所以JVM可以大膽地將vector內部的加鎖操作消除。

鎖粗化

我們知道在使用同步鎖的時候,需要讓同步塊的作用範圍盡可能小—僅在共享資料的實際作用域中才進行同步,這樣做的目的是為了使需要同步的運算元量盡可能縮小,如果存在鎖競爭,那麼等待鎖的執行緒也能儘快拿到鎖。

在大多數的情況下,上述觀點是正確的,LZ也一直堅持著這個觀點。但是如果一系列的連續加鎖解鎖操作,可能會導致不必要的效能損耗,所以引入鎖粗話的概念。

鎖粗話概念比較好理解,就是將多個連續的加鎖、解鎖操作連線在一起,擴充套件成一個範圍更大的鎖。如上面實體:vector每次add的時候都需要加鎖操作,JVM檢測到對同一個物件(vector)連續加鎖、解鎖操作,會合併一個更大範圍的加鎖、解鎖操作,即加鎖解鎖操作會移到for迴圈之外。

輕量級鎖

引入輕量級鎖的主要目的是在多沒有多執行緒競爭的前提下,減少傳統的重量級鎖使用作業系統互斥量產生的效能消耗。當關閉偏向鎖功能或者多個執行緒競爭偏向鎖導致偏向鎖升級為輕量級鎖,則會嘗試獲取輕量級鎖,其步驟如下:

獲取鎖

  1. 判斷當前物件是否處於無鎖狀態(hashcode、0、01),若是,則JVM首先將在當前執行緒的棧幀中建立一個名為鎖記錄(Lock Record)的空間,用於儲存鎖物件目前的Mark Word的複製(官方把這份複製加了一個Displaced字首,即Displaced Mark Word);否則執行步驟(3);

  2. JVM利用CAS操作嘗試將物件的Mark Word更新為指向Lock Record的指正,如果成功表示競爭到鎖,則將鎖標誌位變成00(表示此物件處於輕量級鎖狀態),執行同步操作;如果失敗則執行步驟(3);

  3. 判斷當前物件的Mark Word是否指向當前執行緒的棧幀,如果是則表示當前執行緒已經持有當前物件的鎖,則直接執行同步程式碼塊;否則只能說明該鎖物件已經被其他執行緒搶佔了,這時輕量級鎖需要膨脹為重量級鎖,鎖標誌位變成10,後面等待的執行緒將會進入阻塞狀態;

釋放鎖

輕量級鎖的釋放也是透過CAS操作來進行的,主要步驟如下:

  1. 取出在獲取輕量級鎖儲存在Displaced Mark Word中的資料;

  2. 用CAS操作將取出的資料替換當前物件的Mark Word中,如果成功,則說明釋放鎖成功,否則執行(3);

  3. 如果CAS操作替換失敗,說明有其他執行緒嘗試獲取該鎖,則需要在釋放鎖的同時需要喚醒被掛起的執行緒。

對於輕量級鎖,其效能提升的依據是“對於絕大部分的鎖,在整個生命週期內都是不會存在競爭的”,如果打破這個依據則除了互斥的開銷外,還有額外的CAS操作,因此在有多執行緒競爭的情況下,輕量級鎖比重量級鎖更慢;

下圖是輕量級鎖的獲取和釋放過程


偏向鎖

引入偏向鎖主要目的是:為了在無多執行緒競爭的情況下儘量減少不必要的輕量級鎖執行路徑。上面提到了輕量級鎖的加鎖解鎖操作是需要依賴多次CAS原子指令的。那麼偏向鎖是如何來減少不必要的CAS操作呢?我們可以檢視Mark work的結構就明白了。只需要檢查是否為偏向鎖、鎖標識為以及ThreadID即可,處理流程如下:

獲取鎖

  1. 檢測Mark Word是否為可偏向狀態,即是否為偏向鎖1,鎖標識位為01;

  2. 若為可偏向狀態,則測試執行緒ID是否為當前執行緒ID,如果是,則執行步驟(5),否則執行步驟(3);

  3. 如果執行緒ID不為當前執行緒ID,則透過CAS操作競爭鎖,競爭成功,則將Mark Word的執行緒ID替換為當前執行緒ID,否則執行執行緒(4);

  4. 透過CAS競爭鎖失敗,證明當前存在多執行緒競爭情況,當到達全域性安全點,獲得偏向鎖的執行緒被掛起,偏向鎖升級為輕量級鎖,然後被阻塞在安全點的執行緒繼續往下執行同步程式碼塊;

  5. 執行同步程式碼塊

釋放鎖

偏向鎖的釋放採用了一種只有競爭才會釋放鎖的機制,執行緒是不會主動去釋放偏向鎖,需要等待其他執行緒來競爭。偏向鎖的撤銷需要等待全域性安全點(這個時間點是上沒有正在執行的程式碼)。其步驟如下:

  1. 暫停擁有偏向鎖的執行緒,判斷鎖物件石是否還處於被鎖定狀態;

  2. 撤銷偏向蘇,恢復到無鎖狀態(01)或者輕量級鎖的狀態;

下圖是偏向鎖的獲取和釋放流程


重量級鎖

重量級鎖透過物件內部的監視器(monitor)實現,其中monitor的本質是依賴於底層作業系統的Mutex Lock實現,作業系統實現執行緒之間的切換需要從使用者態到核心態的切換,切換成本非常高。

參考資料

  • 周志明:《深入理解Java虛擬機器》

  • 方騰飛:《Java併發程式設計的藝術》

  • Java中synchronized的實現原理與應用

    http://blog.csdn.net/u012465296/article/details/53022317

看完本文有收穫?請轉發分享給更多人

關註「ImportNew」,提升Java技能

贊(0)

分享創造快樂