從車間一出來,緊接着我們就被帶到了旁邊的停車樓樓頂。這裏正好可以看到旁邊正在建設中的 Fab 38 工地。Fab 38,代號“Sparrow”,是英特爾在 Fab 28 的旁邊修建的一座新晶圓廠,面積差不多(原話“還是4個美式橄欖球場”),但整體技術水平更加先進,耗資超過10億美元。由於 Fab 38 採用了特殊的房頂設計,需要一座極其巨大的起重機才能夠吊起組成房頂的一節鋼架。於是英特爾找來了比利時起重巨頭 Sarens,在 Fab 38 工地上組裝一臺 SGC 系列巨型起重機。這將是目前爲止全球第二大起重機,吊鉤載重達到了驚人的2850噸。(第一大在慕尼黑,客戶也是英特爾)僅爲了組裝這臺起重機都要用到4臺塔吊,花費至少一個季度。而且整個工程實在太大,需要的水泥太多,以至於英特爾直接在工地旁邊修建了自己的水泥廠。Fab 28 代表的是英特爾的今天,而 Fab 38 將會代表這家芯片巨頭的未來。落成啓用後,Fab 38 預計將主要採用更新的 RibbonFET + PowerVia 技術來取代“過時”的 FinFET 晶體管工藝,用於生產 Intel 4、3、20A 等未來製程產品,並且成爲近兩年公司力推的代工服務戰略 IDM 2.0 的基地之一,從而更好地服務亞洲和歐洲的代工客戶。
上世紀70年代美國半導體人才嚴重短缺,英特爾召回了公司早期員工、EPROM 技術的發明者多夫·福羅曼 (Dov Frohman),滿足了他返回故土以色列創辦高科技研究中心的夙願,讓他在海法創辦了 IDC。最初 D 字代表設計 (design),後來全面升級爲研發 (development)。這次我的以色列行程,除了 Fab 28 之外的另一站就是位於 IDC 的芯片測試實驗室。對於英特爾來說,芯片測試並不是從產線上隨機抽個樣,裝到主板上看下能不能開機——整個測試流程非常複雜,要求嚴苛,而且該公司的指標是“每一枚出廠的芯片都必須經過測試”(流程不盡相同)。爲此英特爾在 IDC 大樓內修建了一座巨大的、迷宮一般的芯片測試實驗室,包括開機、驗證、遊戲、跑分、外設兼容、極端環境穩定性等多項測試內容。甚至當芯片出現故障的時候,這裏還有一個神祕的“芯片手術室”,有一組身份對外保密的工程師在裏面,對芯片進行納米級微創手術……另外在前面提到的 IDM 2.0 戰略之下,英特爾還爲包括微軟、戴爾、聯想等在內的 Windows 設備品牌提供測試服務,這些測試工作也是在 IDC 的實驗室環境下進行的。這些測試工作不僅由 IDC 員工完成,每次有新一代芯片問世時,來自全球各地的設計師、工程師都會參與。
接下來正式進入芯片測試實驗室。我們的第一站是開機房 (power-on room)。簡單來說,芯片設計師首先做出紙面設計,然後交到晶圓廠“打樣”,花費幾周到幾個月不等的時間生產出 ES1(工程師樣本)芯片。出廠之後,測試樣品的第一環節就是開機。然後是驗證實驗室 (validation lab)。在這裏,英特爾會進一步對芯片的各項子系統(集成顯卡、邏輯、內存、連通性、兼容性)進行深入的驗證測試。由於英特爾需要在這裏運行數百甚至上千臺測試機,整個驗證實驗室的佔地面積也很大。這樣做的原因是測試工作不能隨便抽幾張芯片進行,必須實現規模化。驗證測試環節會採用一些市面在售的硬盤、內存、顯卡等。但爲了更好地測試芯片對於還未普及的新技術的兼容性,工作人員也會自主設計一些高度定製化的主板、PCIe 模擬卡、USB 外設模擬設備等。比如,測試用的主板就不是市售的,而是英特爾自主設計,名爲“參考驗證平臺” (RVP),裏面的功能和配置都可以通過遠程遙控來實現,省的工程師還要跑來跑去進行調試。再比如下圖中的這張看起來有點像顯卡的東西:其實它是第一臺採用 PCIe 5.0 的設備,是英特爾的測試工程師爲了測試新芯片(包括12和即將發佈的13代酷睿)的 PCIe 5.0 兼容性,而專門自己設計的 FPGA(由 Altera 生產)。PCIe 5.0 測試用 FPGA 圖片來源:硅星人 via 英特爾你可以把這張卡看成是一個“超級模擬器”,它能夠模擬顯卡、存儲、內存、網絡等各種各樣的設備,但它更重要的作用是監控並記錄測試對象芯片對於 PCIe 5.0 設備的控制性能表現。並且由於它是一臺 FPGA,工程師可以輕鬆地使用 DIP 開關以及重新編程的方式來快速修改它的功能和性能——也即調節測試當中的變量。
除了這張 FPGA 卡之外,英特爾還自主開發了很多靈活調節的測試裝備。比如測試視頻輸出,CPU 集成顯卡需要支持多顯示器,但是在實驗室裏每臺試驗檯都裝一堆顯示器太佔地方了,於是英特爾開發了一個像是 U 盤一樣的裝置,能夠模擬多臺顯示器插入的狀態,直接插在主板上就行了。下面這個東西也是英特爾自己攢出來的,專門測試各種 USB-C 接口的性能。大家知道 C 口支持的 USB 版本、傳輸協議、功能非常多,相當混亂,買錯線/轉接頭是常有的事。而英特爾希望能夠確保芯片在儘可能多的情況下設備都能夠正常工作,於是設計了這麼一個能夠模擬各種傳輸協議、菊花鏈等情況。以及下圖紅色管道的裝置:這並不是什麼 CPU 風扇/AIO 之類的東西,它正式的名字是液壓氣動冷卻系統 (HPCS),也可以叫熱管 (thermal head),作用是模擬各種可能出現的溫度變化情況,比如冷啓變熱、熱啓變冷、急熱急冷等,從而確保最終芯片在各種情況下都能夠保持可靠性能。答案當然是送去檢修了。而這些最重要的工作,都在地下的 debug 實驗室完成。最後,我們來到了 debug 實驗室。這裏的工程師的任務是根據樓上彙報的問題找到問題究竟出在在哪裏,確認原因,並且試圖通過各種不同的方式來進行修復,然後將修復結果交給設計師,讓他們去重新修改芯片的設計。一位 debug 工程師告訴我,按理來說,如果自己的設計師同事都在認真無誤地工作,他們應該是失業的……不過現實情況並非如此,在指甲蓋大小的一塊晶粒上,可能要分到幾十甚至上百設計師,每人負責一個區塊。而在區塊之間,很可能因爲電路的順序搞錯了,而導致芯片無法正常工作,“在我們這再正常不過了。”而且,一年到頭出 bug 的概率還是挺小的,所以這支 debug 工程師團隊也並不大(當天在辦公室裏的就五個人)。麻雀雖小,五臟俱全。debug 部門擁有我在整個芯片測試實驗室裏見到的最酷的裝備。圖中右側的 LADA 機器,能夠用高功率激光改變芯片工作原理 圖片來源:硅星人 via 英特爾首先是下面這臺機器,它的名字叫做 LADA,全稱“激光輔助期間改變”(laser-assisted device alteration)。比方說 debug 團隊發現了芯片中的某根晶體管出現了問題,想要驗證一下修改建議是否有效——只需要把芯片放到這臺機器下方,用超高精度和高功率的激光對芯片的指向部位進行照射,就可以修改那根晶體管的屬性,從而改變芯片的工作方式。LADA 機器 圖片來源:Linus Tech Tips而如果激光也不能完全解決問題,需要對芯片動手術,怎麼辦?房間中間的機器名爲 FIB,也即聚焦離子束 (focused ion beam)。這臺機器真的堪稱芯片的手術檯:它先用激光對已經封裝好的芯片進行燒灼。在封蓋上切出一個微米級別的“創口”,然後再用 FIB 對芯片上的電路進行亞微米級別的“修改”。英特爾沒有透露公司一共有多少 FIB 工程師,只是表示達到該公司要求的技術操作級別的操作員,在全世界可能也就兩位數。以下圖爲例:離子束能夠在極微小的電路上架設出新的橋樑,把設計錯誤的電路用正確的方式連接起來。用 FIB 技術對芯片進行物理修改,能夠減少設計方案修改次數,加速方案的驗證流程,最終縮短芯片研發時間和週期,確保滿足英特爾對於一代芯片24-36個月不等的研發週期 deadline。
以上就是這次硅星人對英特爾 Fab 28 和 IDC 芯片測試實驗室的訪問記錄。這次訪問是英特爾在以色列舉辦的 Intel Technology Tour (ITT) 的一部分,共有來自全球十多個國家的數十位分析師參加。ITT 議程還包括即將發佈的13代酷睿芯片的 demo等更多新技術和產品。另外,上週我們也撰寫了一篇對以色列科創環境、創業文化的報道,歡迎各位閱讀。同時歡迎讀者朋友繼續關注硅星人,下週我們將揭曉一款由英特爾開發的跨平臺(電腦/智能手機)的全新軟件產品。測試中的(13代酷睿?)芯片 圖片來源:硅星人 via 英特爾來自第三方公司的工作人員正在測試13代酷睿超頻性能 圖片來源:硅星人 via 英特爾我們在行程中還見到了 Arik Shemer。他是一位芯片debug工程師,和許多以色列早期員工一樣也是從美國“返鄉”的,1978年開始工作,至今已經44年,在公司內部現職員工年份裏卻只能排到前30。不過他很自豪地表示,當年經常拍電報發郵件(不是email)聯絡的同事兼朋友 Pat Gelsinger,如今已經成爲了公司的 CEO……GYAT = get your acts together,英特爾“大名鼎鼎”的公司文化之一…… 圖片來源:硅星人 via 英特爾