1. Java Virtual Machine

​ 人羣當中,一位叫java的小夥子正向周圍一衆人羣細數着自己取得的榮耀與輝煌。就在此時,c老頭和c++老頭緩步走來,看着被衆人圍住的java,c老頭感嘆地對着身旁的c++說道:“原以爲你就可以挑起我的樑子一直走下去的。”

​ c++笑着回應道:“江山代有才人出,這世界以後總會是90後甚至00後的天下!”

察覺到c和c++的java連忙走出人羣,說道:“兩位前輩謙虛了,這世界可還離不開兩位前輩,我只不過是站在了兩位前輩的肩上罷了。”

​ “你這小子可是解決了我們不少的問題啊,像指針、多繼承、內存管理......那時,可是有很多程序員對我們抱怨頗深!”c++誇讚道。

​ “還有Java Virtual Machine,真的是一個不錯的想法!”一旁的c補充道。

......

Java虛擬機,一直都是都是我們在學習Java的過程中反覆提及的一個東西,那麼JVM具體是怎樣的呢?請看下圖:

​ 簡單說來,JVM的工作就是通過類加載系統將字節碼文件加載到內存當中去,加載到內存當中的數據,就從邏輯上形成了我們看到的圖中的運行時數據區(內存模型),

隨後執行引擎操作/調度內存模型中數據執行程序。

​ 現在看到內存模型裏面的東西,大家是否有些眼熟呢?現在回想起自己面試時,遇到的JVM面試題是不是全是關於內存模型裏面的東西。比如:棧、堆、Eden、Survivor、GC等等。

2. 舉個小栗子

public class Example{
	public int add(){
		int a = 3;
		int b = 4;
		int c = a + b;
		return c;
	}
	public static void main(String[] args){
		Example e1 = new Example();
		e1.add();
		//.......
	}
	//......
}

​ 這個栗子是在幹啥,不用多說吧!今天我們就要來慢慢地剝開它,以往剝開喫得太快就沒有什麼感覺了。

3. 棧

​ 棧,全稱爲Java 虛擬機棧,線程私有,生命週期和線程一致。描述的是 Java 方法執行的內存模型:每個方法在執行時都會牀創建一個棧幀(Stack Frame)用於存儲 局部變量表操作數棧動態鏈接方法出口 等信息。每一個方法從調用直至執行結束,就對應着一個棧幀從虛擬機棧中入棧到出棧的過程。

​ 怎樣解釋上面的話呢?那就需要開始剝栗子了!刀來(大喝一聲)!

​ 當栗子開始執行時,由於只有一個main線程,因而JVM只需要爲main線程分配好棧區的內存(話句話說如果有多個線程,自然就會有多個棧區,並且爲各自線程私有)。OK! main繼續執行,就會遇到main()方法,遇到之後呢!JVM又會在棧區當中再劃出一個小塊來存放main()方法執行過程的數據,這一小塊區域也就是棧幀。main()方法執行過程中又有一個add()方法出現了,同樣地,JVM又會再爲add()分配一個棧幀,同時壓入到棧區,以後再遇到其他方法也是如此。當然,方法在執行完成之後,便會彈出並釋放內存,當線程中棧區的所有方法都返回之後,程序也就算是執行完畢了。

​ 那麼棧幀又是何許物業?咦,我刀呢?算了,手撕吧。

​ 當我們扯開棧區,撕開棧幀,一不小心,局部變量表、操作數棧、動態鏈接、方法出口......嘩啦啦地散落一地。

​ 撿起add()棧幀的局部變量表和操作數棧就可以看到這樣一個畫面,在執行栗子中add()方法中的三行代碼時,局部變量表和操作數棧的一個變化過程:首先,執行 int a = 3; 局部變量表中會分配出一個int區域,表示爲a;同時iconst命令使得操作數棧中壓入了常量3,然後再由istore命令將3彈出,賦值給局部變量表中a。同樣, int b = 4; 這一行代碼也是如此。然後, int c = a + b; 從右往左開始,先執行 a + b ,也就是iload命令從局部變量中取出a、b對應的值,再將iadd後的值push進操作數棧中,剩下的便是 int c = 7 的操作了。

​ 通過上面的栗子,就很容易明白;局部變量表,顧名思義就是存放每個方法中的局部變量(即編譯器可知的各種基本類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference 類型)和 returnAddress 類型(指向了一條字節碼指令的地址))所在處,如圖中的a、b。操作數棧,也就是存放的就是方法當中的各種操作數的臨時空間,又如栗子中的3、4。

​ 動態鏈接:Class文件的常量池中存在有大量的符號引用,字節碼中的方法調用指令就以指向常量池的引用作爲參數,而將部分符號引用在運行期間轉化爲直接引用,這種轉化即爲 動態鏈接 。這個解釋當中會涉及到許多概念,比如常量池、符號引用等,要想理解這些概念,就需要去了解class文件的結構,內容太多就不在這裏詳細描述了。

​ 方法出口:簡單來說,就是用於標記當前方法執行完成之後,應該返回到下一條指令執行位置。比如就上面的栗子而言,add()在執行完畢之後,就應該返回到e1.add()之後繼續執行main()後面的代碼。

4. 堆

​ 對於絕大多數應用來說,這塊區域是 JVM 所管理的內存中最大的一塊。線程共享,主要是用於存放對象實例和數組。除此之外,堆區還涉及到JVM中一個非常重要的工作--GC(Garbage Collection)。

​ 從圖中就可以看出棧和堆之間的關係,對於new的對象,棧中局部變量表只會存放在堆中的地址引用,具體實例變量的空間分配都在堆中。

​ 而堆中的內存區域又會劃分爲年輕代和老年代兩部分,其中一般情況下年輕代佔1/3內存,老年代佔2/3內存;年輕代又被劃分爲Eden區(伊甸園區)和兩個Survivor區(倖存區),各自分別佔年輕代空間的8/10、/1/10、1/10。也就是說如果堆內存區域有600M,那麼年輕代200M、老年代400M、Eden區160M、S0區20M、S1區20M。

​ 這樣劃分區域的目的是什麼呢?這個回答就關係到JVM的GC機制了。

​ 首先,程序一開始,所有的實例對象都會生成在Eden區中,當Eden區滿了的時候,這時就會觸發minor gc,jvm使用gc roots的查找方式將 垃圾對象移動(複製算法)到S0區域中去,並且將Eden區中的其他對象視爲垃圾對象,清空Eden區。

​ 當實例對象再次充滿Eden區時,又會觸發minor gc;但是這次是將Eden區 S0區中的所有非垃圾對象移動到S1中,並清空Eden區和S0區;同樣下次minor gc時,就是將Eden區和S1區中的非垃圾對象轉移到S0中......當然,這個左手倒右手過程並不是無休止的。在反覆minor gc的過程中,每個對象身上還有一個叫做分代年齡的屬性,每次minor gc對象的分代年齡就會加1,當達到15(默認情況)時,這個對象就會被放到老年代中去,成爲長期存在的對象。除此之外,還有一種情況,即是當從Eden區複製內容到Survivor區時,複製內容大小超過S0或S1任一區域一半大小,也會直接被放入到老年代中,所以老年代纔會需要那麼大的區域,不然怎麼抗得住這些年輕人這樣搞~~。

​ 雖然老年代空間很大,但總會有滿了的時候,這時麻煩的事情就出現了——full gc。在full gc時,jvm會先觸發STW(Stop-The-World),也就是暫停其他所有的java進程,回收整個內存模型當中的內存資源,從而造成用戶響應超時或者是系統無響應,這對於併發程序比較高的系統(比如秒殺活動)影響程度是極其之大的。

​ 通過gc機制,我們就可以得出一個簡單有效的JVM優化辦法,那就是減少full gc的次數,如何減少呢?只需要調整老年代和年輕代的內存空間分配使得在minor gc的過程中儘可能的消除大部分的垃圾對象。比如這種java -Xmx3072 -Xms3072M -Xmn2048M -Xss1M

​ -Xmx3072M:設置JVM最大可用內存爲3072M。

​ -Xms3072M:設置JVM初始內存爲3072M。此值可以設置與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配內存。

​ -Xmn2048M:設置年輕代大小爲2G。增大年輕代後,將會減小年老代大小。不過此值對系統性能影響較大,Sun官方推薦配置爲整個堆的3/8。

​ -Xss1M:設置每個線程的堆棧大小。JDK5.0以後每個線程堆棧大小爲1M,以前每個線程堆棧大小爲256K。更具應用的線程所需內存大小進行調整。在相同物理內存下,減小這個值能生成更多的線程。

GC Roots: 在上面的gc過程中,我們還提到了JVM是如何判斷垃圾對象的。簡單地來說,就是從gc roots的根出發(即局部變量表中的引用對象),一路沿着引用關係找,凡是能夠被找到的對象都是非垃圾對象,並且會被移動到下一個它應該去的區域中。剩下的對象,會在區域清空時,一同被清理掉而無須關心。

5. 小結

​ 除了棧、堆之外,還有程序計數器、方法區(元空間)、本地方法棧,這些相對比較容易理解。

​ 程序計數器:用來記錄當前指令執行完成後下一條指令的位置,由執行引擎來完成相應的修改操作。

​ 方法區(元空間):存放常量、靜態變量、類信息等。

​ 本地方法棧:與java虛擬機棧類似,不過存放的是native方法執行時的局部變量等數據存放位置。因爲native方法一般不是由java語言編寫的,常見的就是 .dll 文件當中的方法(由C/C++編寫),比如 Thread 類中 start() 方法在運行時就會調用到一個 start0() 方法,查看源碼時就會看到 private native void start0(); 這個方法就是一個本地方法。本地方法的作用就相當於是一個“接口”,用來連接java和其他語言的接口。

​ 另外,對於new出來的對象,無論是在棧的局部變量表還是在方法區中的空間中,存放的都只是對象在 中的地址(引用),具體的空間分配是在堆中。

公衆號:良許Linux

有收穫?希望老鐵們來個三連擊,給更多的人看到這篇文章

相關文章