摘要:很多政府機構也會參加然後說:“我們在這裏有個問題,我們想在這方面多做些嘗試。或者我可以回頭看看,然後說:“哇,我們可能沒有做到這一點,但我們做得很好。

上週,當全球最大的存儲芯片製造商之一美光科技(Micron Technology)收購人工智能硬件和軟件初創公司Fwdnxt時,我一直在關注此事。

此舉可能會非常有趣,如果成功的話,Fwdnxt可能會讓美光與英特爾和英偉達等合作伙伴展開直接競爭,因爲美光相信,內存和人工智能計算正在融合到同一個架構中。

美光負責這個項目的其中一位高管是Steve Pawlowski,並非偶然,他曾是英特爾的芯片設計師,擁有數十項專利。Pawlowski現在在美光公司擔任高級計算解決方案副總裁。

Fwdnxt將與美光的存儲芯片進行結合,幫助美光探索數據分析所需的深度學習人工智能解決方案,特別是在物聯網和邊緣計算方面。也許美光也會生產基於人工智能的內存芯片,或者包括人工智能在內的內存芯片。

總部位於博伊西的美光公司正在做這項工作,該公司首席執行官Sanjay Mehrotra說,因爲“曾經的計算架構並不適合未來的發展趨勢……從長遠來看,我們認爲計算最好在內存中完成。”

外媒在上週Micron Insights的活動上採訪了Steve Pawlowski,以下是經過編輯整理的採訪實錄,由獵雲網編譯。

Steve Pawlowski:2014年我離開英特爾的時候,我來到了美光,他們問我:“你想做什麼?”我說:“我認爲,爲了提高性能效率和降低延遲,計算和內存的融合是必要的。你們是一家存儲公司,你們有技術,DRAM即將到來,我想在這一領域作出改變。”然後他們說:“好吧!”

我有一個小團隊,專注於在計算和內存方面發現問題——我們可以開始測試概念,然後將概念引入產品,但不會增加成本。我在英特爾學習到的,一件我永遠都不會忘記的事情,我們曾經有算數協同處理器,80287,80387,然後我們在387上賺了一大筆錢。當時我們有了一個聰明的想法,如果我們把協處理器集成到486中,我們可以做得更快更好。我們做到了,但突然間我們就沒有足夠的足跡了。那些不需要它的人說:“你不會爲了那個死亡區域向我收費”,而那些需要它的人說:“會像其他人一樣付給我錢,因爲我是一個受歡迎的顧客。”然後,整個業務就歸零了。

這件事給我的一個教訓是,你不能增加更多的複雜性和成本,然後指望人們馬上爲它買單,除非,有大多數人能從中獲得真正的價值。我們現在重點關注的是,找到人們今天可以從中獲得價值的關鍵因素,然後看看你能否隨着時間的推移擴大這個泡沫。我認爲這是一個8到10年的旅程。在那些年的最後,當我回首往事時,我可能會意識到我浪費了它們。或者我可以回頭看看,然後說:“哇,我們可能沒有做到這一點,但我們做得很好。”

Q:這引發了很多關於這會導致什麼後果的想象,你會給出一些具體的暗示嗎?

Steve Pawlowski:有一件事,你肯定已經聽過很多次了,那就是AI正處在邊緣。我們關注這個問題的原因是,沒有一個現成的編程模型或現成的架構可以讓你與市場競爭。可以說,每個人都在爲進入同一個戰場而鬥爭。現在,我們有機會去那裏做點什麼了。人們不會看着你說:“美光是一家內存公司,你爲什麼要談這個?”事實上,他們是這樣認爲:美光在FPGA上有這種能力,我們的高性能內存和架構映射在FPGA之上。我們會負責所有的抽象,所以你不必成爲一個VHDL程序員,那麼你願意開始處理數據集的問題嗎?

有趣的是,我並不需要主動去推動它。我們經常會參加FPGA會議。很多政府機構也會參加然後說:“我們在這裏有個問題,我們想在這方面多做些嘗試。”政府的問題是,他們很早就興奮了,但如果你想做成什麼事情,那就得花很長時間。因爲採購週期很長,合同也是長期的,其他的一切都是長期的。

我們決定看看普通市場。有一家汽車公司來了,他們說:“我們還沒有達到第五級,但我們肯定可以達到第三級、第四級的自動駕駛汽車,我們希望能夠利用網絡告訴我們正在發生什麼。這看起來是有趣的,你願意和我們一起工作嗎?”還有很多人說:“他們爲什麼對與你們展開合作感興趣?”這是因爲我不會直接告訴他們需要做什麼,我會說“這就是我們所擁有的,然後我們能爲你做些什麼呢?”他們會說:“好吧,你願意聽我們的,這是我們的問題。”

不管你信不信,我從2005年AMD推出的Opteron中吸取了教訓。我們仍在推廣7g處理器、33-stage管道,但無人問津。我們去了華爾街,我說:“你能再給我們一次機會嗎?我們能坐下來了解一下我們的工作量嗎?讓我們一起合作,我們可以創造更好的產品嗎?”事實證明,我們做到了。

我們找了很多人。瑞銀,我記得他們寫的一篇評論文章,他們說:“你可能不會製造最大的芯片或最好的芯片,但你來了,理解了我的問題。”這就是所謂的,真正理解客戶和他們的問題,以及你能做什麼。如果你這樣做對他們沒有幫助,也沒關係,至少你學到了一些東西。

Q:就縮小範圍而言,它是在開發一種新的內存,還是在計算處理過程是在哪裏完成的?

Steve Pawlowski:答案是肯定的,但它是對動態真正的理解。順便說一下,這取決於型號。我剛纔和下面的人聊了聊有些語言模型需要100g的參數。當你看到有人說:“嘿,我有兩個千兆字節,四個千兆字節。”那會適合大多數型號,但不是所有的型號,型號確實在不斷發展。

這也取決於解決方案的延遲。我不知道你們是否看過OHSU的視頻,那位女士患了乳腺癌,他們需要大量的數據,因爲他們想把所有的電子顯微鏡圖像放在一起,建立一個三維卷積模型,一個針對腫瘤的三維顯示。他們沒有足夠的時間去了解,因爲他們想要在一天甚至一個小時內獲得切實可行的洞察力。我們在歐洲核子研究中心做的工作,我們現在需要數據。我們必須在幾微秒內做出決定。這是什麼有趣的東西,還是我們把它放棄。

不同的解決方案需要不同類型的內存,這也是我們正在學習的。我一直喜歡英特爾的一點是,用戶知道程序的指令是什麼。我瞭解它們是如何在機器上執行的,然後逐漸進入系統。當我來到美光的時候,我看到的只有地址和命令,就是單純的讀/寫命令和地址。我完全不明白,這個東西是把15個不同的東西複製到不同的元素上,還是覆蓋上去,還是什麼?有了我們在6月合作和收購的這些公司,我們就可以構建這些算法、運行它們,看看整體效果如何。

我們的第一個目標是,我們能在內存中做些什麼來提高解決方案的運行時間?我們可以建立更高的帶寬,但那不一定能讓用戶達到目的。如果我們能建立一個緩衝區,引入一個矩陣,讓我們一下子就能把矩陣移過來,而不是讓這個東西去找它,這可能會帶來巨大的好處。

最後,我們還會看到:其中大多數是乘法和累加的架構,以及非常簡單的一些架構。它們只是被複制了幾千次。一旦晶體管變得更好,你就可以在存儲設備上做一個很好的乘法和累加。最終,設想一下采用這種架構,然後把它放在一個內存設備本身中,這是一個長期的願景。

我想說的是,無論我們做什麼,我們都要建立一個編程基礎設施和一個範例,這樣人們就不必每次遷移時都重寫他們的代碼。在我看來,這就是英特爾的巨大成功。當我們做386的時候,還沒有32位的軟件。但它確實能很好地運行16位代碼,人們買它就是爲了這個。你可以有很多平臺,然後人們說:“好吧,現在我們去優化32位。”6到8年後,當486問世時,有很多軟件可以利用它,然後它就變成了一臺永不回頭的機器。

先從內存開始,先從存儲開始,看看我們能做什麼。然後我們將看到什麼可以隨着時間的推移而真正地遷移,答案可能是什麼都不能,答案也可能是一切都能。我想答案是在中間的某個地方,這取決於你把針移到哪裏。

Q:是什麼讓這個項目變得如此困難,以至於可能成爲一個歷時10年的項目?

Steve Pawlowski:困難的是,這將是一個爲期10年的項目。提出一種編程範式,社區就開始使用它,這樣你就可以開始把編程帶到社區。我不知道你是否知道Steve Wallach(來自Tracy Kidder的一本書),他是多年前的Tracy Kidder的靈魂。他剛退休,但他曾爲我工作了一段時間。每次一對一的時候,他都說:“如果我要教你什麼的話,就是這個。最容易編程的東西就是獲勝的關鍵,屢試不爽。”底線是,你必須讓編程社區參與進來。你不能只是去做一些花哨的硬件,然後把它們丟在一邊,因爲它們不會碰它,這是個難題。

我們還不是軟件公司。我剛開始創業的時候,英特爾還不是一家軟件公司。他們就像Nvidia,有很多軟件工程師,在某些情況下甚至超過了他們的硬件工程師。你只是看不到他們。

Q:你們拿下了Fwdnxt,它是一個很全面的產品了,那麼你們還需要找很多合作伙伴嗎?

Steve Pawlowski:我們需要大量的合作伙伴和數據科學家,他們的推理機架構已經開發了5年,10年,12年了。優化它們的人來自不同的公司和不同的學術環境,它的創始人是普渡大學的教授,他們一直在優化這個架構。他們有一個相當好的編譯器,採用了一個開放的網絡交換前端,然後將其映射到他們的硬件上。

我需要的是數據科學家,是應用程序。我還認爲我們需要一個動態運行時/調度程序。如果你真的有這個模型,如果我今天在硬件上寫一個網絡,在英特爾處理器上,三年後你仍然可以運行同樣的程序,所有的東西都是通過指令集抽象出來的。因此,在這裏我要做的是抽象網絡,這意味着我們需要某種類型的動態運行時。也就是說,“啊,這個東西有8000個乘法和累加單位,這個有1000個,那我可以把那東西再分散一點。哦,這150個單位死了。我不想在這些方面做任何安排,但我仍然希望能夠使用該部分。”

有幾個實體一直在尋找解決動態運行時問題的方法,我認爲這是非常重要的,尤其是我聽說過估計值。一年前,我在機場遇到了一個在英特爾公司經營Litho的人。他說,他們相信當達到5nm以下時,30%的設備在製造時會不合格。

Q:你是說有缺陷,還是什麼?

Steve Pawlowski:只是不符合規格。我們把所有的東西都裝在護欄裏,假設它的壽命是7年,而且質量會下降。基於這個特殊的原因,你甚至無法護衛它,它甚至也不能在guardrail里正常工作。

我找到了一篇由巴西研究者寫的論文,上面說如果你有,假設你可以做512個核,那麼你會降低20%。與峯值性能相比,總體性能下降約4%。32核芯片已經失效,在64核芯片中,只有一個內核處於活動狀態。他們只是假設這些值是隨機分佈的。如果我們要使用比7更好的幾何圖形,那麼爲這些大型應用程序提供動態運行時將同樣重要。

多年來,內存系統一直存在冗餘。他們在測試,會在一個冗餘塊中交換,如果壞塊比冗餘塊多,這就變成了一個密鑰鏈。

Q:這是否意味着與英特爾和英偉達等公司的競爭很激烈?

Steve Pawlowski:這樣會更有合作精神。美光在數據中心很難與英特爾和英偉達競爭,英偉達已經鎖定了訓練。即使有人提出了新的解決方案,至少有一家初創公司告訴我,超級計算者告訴他們:“很難把我們的訓練算法從GPU上轉移出來。它做得很好,仍在提高我們的業績。不要把你的時間花在這上面。”我最後聽到的統計數據,很大一部分推論仍然在Xeon上運行。

我們一直在關注——如果我們要在數據中心做些什麼,那就是幫助我們的客戶,比如英偉達和英特爾。但是如果從內存存儲的角度來看有什麼創新,讓我們來看看它的邊緣。我們將在那裏獲得最大的效率和規模經濟。

Q:摩爾定律的部分還可以嗎?你們會準時嗎?

Steve Pawlowski:這是一個挑戰,但這並沒有阻止我們繼續擴大規模。老實說,我必須永遠活在摩爾定律裏。不許說摩爾定律的壞話!這是第十一誡。因此當人們問我的時候,我的回答是:Dennard規模增長的放緩和停止纔是真正推動創新的原因。現在,我們可能不會每兩年得到兩倍的晶體管,也許是每三四年一次。但我們會在第三維度成長。這一切並沒有阻止我們。問題是怎樣做最經濟,工程師們會爲難題找到真正有創意的解決方案。

Q:英特爾今天強調,他們將在2021年推出7nm圖形芯片。他們似乎回到了預定的時間。

Steve Pawlowski:我希望如此。在我離開的時候,那是5年前的事了,4年的領先優勢消失得如此之快,令人驚訝。

Q:從這個意義上說,似乎整個行業都在同步前進。

Steve Pawlowski:我認爲這個行業還在繼續他們的步調:“我們仍然可以看到一條通往規模化的道路。”就像我說的,我不知道這是否是摩爾預測的激進的兩年,但想想過去40年來,由於摩爾定律,我們在能力方面取得了哪些進展。太不可思議了!我仍然認爲會出現規模擴張,我們會像其他人一樣利用它。

Q:Fwdnxt交易給你帶來了什麼?是更多的軟件方面的業務,還是也有芯片製造領域的人才?

Steve Pawlowski:不是真正的芯片製造天才,並不是的。他們是建築天才,他們有硬件架構方面的天賦。他們已經翻譯了FPGA。在採取這方面,使ASIC和做前端和後端,這不是他們的專業知識,但是是他們現在在做的地方。他們帶來了軟件和體系結構,不僅是硬件的體系結構,還有卷積神經網絡的體系結構知識。如果有人向他們提出一個問題,他們如何能夠對該網絡進行優化,然後使用他們的數據對其進行訓練,以獲得他們想要的精度水平。一旦他們達到了他們想要的精度,他們就把訓練好的算法映射到FPGA上進行分類。

Q:所以它會給你提供多種選擇,讓你選擇想做什麼。

Steve Pawlowski:我完全把它看作是,我們正在學習這些東西是如何相互作用的,以及這些不同的網絡是如何進化的。好的方面是,我可以放一個有一百萬個參數的網絡,就是說我可以放一個100gig的網絡參數。它的運行速度較慢,但我能夠理解那些大型網絡將如何發展,以及我們將做些什麼。

我在小組裏討論了我們是如何與歐洲核子研究中心合作的。我們從原型設計中學到的東西是驚人的。他們以如此快的速度把數據扔給它,他們需要如此快的洞察力。準確性是好的,但他們不需要像癌症患者那樣緊迫的東西,而你需要99.999%的準確性。他們會問,“這70%或80%好嗎?這很有趣嗎?沒有?那就不要了。把它扔出去。我們有更多的東西要對付,最終我們會得到一些達到這個門檻的東西,那將會很有趣。”他們每秒會發生4000萬次碰撞。

Q:你對這種方法能解決的問題的一般描述是怎樣的?

Steve Pawlowski:這兩個問題,衛生保健和歐洲核子研究中心,基本上他們是用2D傳感器圖像構建一個3D模型。在歐洲核子研究中心一號上,粒子相互碰撞,產生了大量其他粒子。他們想要做的是快速測量這些粒子然後問:“所有的能量加起來了嗎?”如果能量是X,你得到Y,它小於X,然後有一些能量沒有被考慮進去,這是很有趣的科學,因爲能量守恆定律說沒有任何東西應該被創造或毀滅。一旦他們這樣做了,他們就會想要獲得不同的圖像並構建一個關於衰減的3D模型,因爲它不會全部顯示在相同的2D圖像中。

可視化腫瘤需要很多很多二維圖像,X光,等等,並創建一個三維的體積模型。我們使用相同的3D卷積神經網絡樣式,因爲它們是不同的網絡,它們有不同的內層做不同的事情,但是我們用它們來解決一個類似的問題,即創建一個3D的表現。

Q:我不知道你是否聽說過MediView公司。他們來自克利夫蘭診所,剛剛籌集了450萬美元的風險投資。他們對病人的身體進行核磁共振成像,所有的東西都在裏面,然後他們把數據放入微軟全息眼鏡。然後醫生就可以用3D技術將其可視化。你把手術刀放到病人身上,他看到手術刀穿過小孔,進入他想要的地方,否則他就不會看到裏面的情況。以前,他必須根據他所看到的所有2D屏幕進行猜測。

Steve Pawlowski:那太棒了。幾年前,俄勒岡健康科學大學的外科主任說:“你需要來這裏。”當時我在英特爾,他們給我們洗了全身,給我們做了雙疝氣手術,他說:“我想給你們展示我們現在是怎麼做手術的。”他們仔細檢查了一切。當然,這個人並不是完全開放的,否則我就不會去做手術了。手術結束後,他說:“現在,讓我向你們展示如何訓練我們的外科醫生。”就工具而言,它就像石器時代。這將是一個完美的教學工具。

相關文章