原標題:英特爾花了5年布了一個大局

下棋對弈,一般選手只能看三五步,而頂尖高手可以看到20步!這就是戰略思維!頂級企業必須有戰略思維!而戰略一旦制定,就會堅定不移地執行下去,英特爾就是這樣一家企業。

近期,英特爾總是處於風口浪尖,常常被媒體們拿來做創新乏力的典型來鞭笞,因爲,這5年來,英特爾的種種作爲讓很多人看不明白,它似乎偏離了主航道,而對手們則似乎在高歌猛進。

但是,

時間是個好東西,它可以讓我們捋清真相。

其實,

這5年來,英特爾布了一個大局,所有的收購、戰略調整、人事變動都是圍繞這個大局,到2020年11月11日,也就是我們熟悉的雙十一那天,英特爾終於把最後一個空填滿,這個大局成了,它要支撐英特爾未來十年的高速發展。

1、5年回首

要理解英特爾的大局,讓我們先捋一捋英特爾這5年都幹了什麼。

2015年,英特爾洞察到數據的顛覆性作用,提出數據將改變未來計算格局乃至整個世界。

2015年6月,英特爾以167億美元天價收購了FPGA 二當家Altera,開啓了其長達5年的佈局之旅。

2016 年8月,英特爾出手收購了主攻深度學習的公司 Nervana Systems ;

2016年9月,英特爾再出手收購了計算機視覺初創公司 Movidius,該公司主要產品爲低功耗視覺處理器Myriad 系列 VPU。

2017年,英特爾確立“以數據爲中心”的戰略轉型目標,致力於釋放數據指數級增長帶來的無限潛能,並以“六大技術支柱”的共同創新爲突破口,爲業界提供領先的數據處理、存儲和傳輸的雲到端產品與解決方案,爲驅動科技發展與創新奠定基石。

2017年3月,英特爾收購了自動駕駛領域的領軍企業Mobileye ,這家創建於 1999 年的以色列公司,主要致力於汽車計算機視覺領域的研究。

2017年11月,時年49歲的GPU領域大神--他曾是AMD Radeon Technologies Group 的部門負責人 Raja Koduri加盟英特爾,擔任英特爾 GPU 首席架構師、高級副總裁以及新成立的核心和視覺計算事業部(Core and Visual Computing Group)邊緣計算解決方案總經理。現年49歲的Koduri是一位從業二十多年、經驗豐富的明星,他成了英特爾大局中的關鍵人物。

2018年7月,英特爾收購eASIC公司,eASIC可爲“結構化ASIC”開發FPGA設計工具。結構化ASIC是FPGA和ASIC之間的中間體,可滿足快速推出和低成本需求。從技術上講,英特爾自2015年以來一直在其定製Xeons中使用eASIC技術,但這次收購意味着eASIC團隊將成爲英特爾可編程解決方案組(PSG)的一部分。

2019 年12月16日,英特爾以20億美元收購Habana Labs,這是一家爲數據中心提供可編程深度學習加速器的廠商。Habana的Gaudi人工智能訓練處理器目前正在爲特定超大規模客戶提供樣品,與使用同等數量GPU構建的系統相比,基於Gaudi的大節點訓練系統的吞吐量預計將增加4倍。Gaudi旨在讓系統實現高效靈活的橫向、縱向擴展。

2020年11月11日,英特爾終於把最後一個空填滿--英特爾正式宣佈® oneAPI Gold工具包將於今年12月正式交付,此外,英特爾正式發佈其 首款數據中心獨立圖形顯卡。該服務器GPU基於Xe-LP微架構,專爲高密度、低時延的安卓雲遊戲和流媒體服務而設計。

英特爾高級副總裁、首席架構師兼架構、圖形與軟件部門總經理Raja Koduri表示:“ 今天是英特爾oneAPI和XPU宏大計劃的重要時刻。隨着oneAPI Gold版本的發佈,開發者編程體驗將更加豐富,oneAPI不僅擁有開發者熟悉的CPU編程庫和工具,也包含矢量-矩陣-空間這種混合架構的編程庫和工具。同時,我們還推出了基於Xe-LP微架構的首款數據中心GPU,以滿足快速增長的雲遊戲和流媒體市場需求。”

5年時間 ,英特爾完成了戰略轉型和升級。

同樣是11月11日,蘋果發佈基於ARM架構的筆記本處理器M1,其“彪悍”的性能讓很多媒體在吹捧的同時不忘再把英特爾拉來當做反面典型鞭笞和嘲諷。

“牙膏廠”是英特爾的別稱,形容其處理器性能改進如同擠牙膏。

不過

燕雀焉知鴻鵠之志

英特爾志存高遠,又豈會在終端一顆芯片上糾結徘徊?英特爾的目光瞄上的是另一個大市場!

2、數據大局

要理解英特爾的大局,我們先要看看未來世界最重要的趨勢。

毫無疑問,數據是未來最重要的資源,數據無處不在 ,對數據的分析和提煉又反過來給我們的現實世界提供幫助---這就是人工智能技術,所以大數據和人工智能是未來最重要的兩個技術,而隨着5G的商用,又會加速這兩個技術的融合和普及。

過去30年,計算是英特爾的主旋律,圍繞計算,英特爾不斷增強處理器性能,不斷提升工藝技術,而未來,數據將成爲英特爾的重點。

如今,無論是汽車、零售商店,還是醫院、家庭、工廠,所有物和設備變得越來越像一臺臺“計算機”,智能變得無處不在,數據不僅呈現指數級增長,其形態也變得日益多樣化。

數據顯示,從2018年至2025年,全球的數據增長量達到5倍以上,將從2018年的32 ZB增至2025年的175 ZB。然而,這些數據的分析和使用必須藉助數據中心強大的計算平臺來完成,對數據中心而言,這是難得的機遇,更是前所未有的挑戰。

然而,未經處理的數據毫無價值,只有將數據轉化爲業務價值,才能創造新的服務和體驗。英特爾認爲, 人工智能、5G、邊緣智能是當今三大轉折性技術領域。這三項技術的交匯與疊加,是構建下一波應用創新的關鍵驅動力。

這三項技術如何交匯與疊加?開發者該如何使用挖掘各種數據價值?該構架一個什麼樣的平臺來全球開發者共享數據洪流?

5年來,英特爾所做的工作就是對這些問題的回答--我的理解就是英特爾要打造一個能支持各種數據處理、挖掘、支持跨平臺開發的軟硬件一體化雲端平臺,以便把各種數據一網打盡,輸出價值。

所以,5年來,英特爾所有的佈局都是圍繞這個目標,六大技術支柱其實就是它實現這個目標的手段--分別從處理器架構、工藝、封裝(實現異構處理器)、互聯、存儲、軟件、安全去打造一個新的平臺。

隨着5G的應用深入,我們看到未來雲、邊、端一體的趨勢日益明顯,以人工智能爲例,雖然是仿生人類大腦,但在實現上有很大不同,未來人工智能必然是端側+邊緣側+遠端相互協調,端側和邊緣側可以做輕量級的推理,而云端做訓練和重量級的推理。

再以我們熟悉遊戲爲例,隨着5G的到來,雲遊戲會成爲未來趨勢。這是我參加最近的紫光展銳峯會時阿里巴巴的分享,阿里巴巴認爲未來是雲遊戲時代,而云遊戲時代的硬件架構雖以X86和ARM處理器爲主,服務器GPU是影響雲遊戲的關鍵,視頻編解碼和壓縮技術也是影響雲遊戲的體驗的關鍵,這些都是和數據處理有關的。

但是 ,阿里巴巴認爲未來端側CPU將變得不那麼重要!

因爲很多處理將在雲端進行!其實何止遊戲,未來的很多數據處理都會在雲端處理 ,而端側可能是數據的一個入口而已。

所以,還在爲蘋果M1高潮的人是不是可以先不要那麼嗨?因爲,一個新的時代開啓了,原來你看中的東西可能在新時代不合時宜。

就如同二戰初期列強所推崇的戰列艦,一味追求火炮口徑,以超強的火力稱霸,日本就造出了當時全球最大口徑火炮的大和號,但是這個最大口徑火炮的戰列艦最後被航空母艦艦載機給炸沉了。

所以,面對未來趨勢,要用新的架構和理念去應對。

未來數據和雲時代,我們更需要能在服務器端對海量數據提供快速處理器的平臺。

有人會說那我喜歡單機版遊戲,我就需要端側的高性能處理。

是的,這就跟懷念像素級街機遊戲的人一樣,這樣的需求總歸是小衆,已經不是時代主流,未來的主流遊戲必然是雲化,VR化,AR化。

這樣的趨勢不是英特爾一家看到,其他廠商也看到了,我們再看看今年的兩個重量級收購:NV收購ARM和AMD收購賽靈思,其實都是衝着這個趨勢去的。

不過,他們做的事情其實英特爾5年前就已經做了。

而且,英特爾的局更大。

不過要實現這個目標需要解決兩個至關重要的挑戰。

3、異構

和以往不同,現在我們面臨的數據量大,而且種類繁多-這些數據有來源於不同的計算架構,它們有標量數據(CPU)、矢量數據(VPU)、矩陣數據(人工智能計算數據),空間數據(FPGA)等,要處理這些數據必須從軟硬件兩個方面下手。

硬件方面,這樣的趨勢催生了異構處理器的概念,就是把不同的處理器封裝在一起。對於異構的理解可以看看這個視頻。

但是要把不同處理器封裝在一起,必須解決散熱、總線連接等問題,否則這樣的封裝就是失敗的。爲了解決異構挑戰,必須重點突破封裝技術,所以英特爾把了封裝技術列入六大技術支柱之一,英特爾的一位院士告訴我在以數據爲中心的時代,先進封裝將比過去發揮更重大的作用。

他說先進的封裝技術能夠集成多種製程工藝的計算引擎,實現類似於單晶片的性能,這些技術將大大提高產品級性能和功效,縮小面積,同時對系統架構進行全面改造。封裝不僅僅是製造過程的最後一步,它正在成爲產品創新的催化劑。

在2019年在七月初的SEMICON West大會上,英特爾推出了一系列全新基礎工具,包括將EMIB和Foveros技術相結合的創新應用(Co-EMIB),全方位互連(ODI)技術,和全新裸片間接口(MDIO)技術。 通過多芯片封裝(MCP)實現低延時、高互連速度,高性能的系統,它帶來的好處有以下幾點:1、尺寸縮小,可以將原來4000平方毫米的板級設計縮小到700平方毫米!

2、實現超薄封裝、未來更有希望實現無核,嵌入式的橋接。

3、實現高速信號互連,目前 已達到112Gbps,正努力邁向224Gbps。同時,通過電介質材料發明和金屬表面粗糙度降低損耗。

4、通過2D、3D封裝實現高寬帶互連,3D互連指的就是兩個裸片疊在一起,2D互連指的是兩個裸片進行水平的連接。

如果對比英特爾和臺積電的高級封裝技術,你會發現,在相同功率密度下,英特爾的MDIO在帶寬密度上更高效,另外,英特爾還把異構從單純的處理器引申到系統概念,也爲未來的數據處理打下了基礎。

異構問題解決以後,針對未來各種數據處理,還需要解決一個最大挑戰--這就是軟件平臺,如何構造一個支持多種處理架構的跨平臺的軟件平臺?

爲此,英特爾做了兩件事情:

一、開發自己的獨立顯卡--Xe 架構GPU

很多人認爲,英特爾開發獨立顯卡是爲了對抗NV和AMD ,其實,這只是爲了補齊自己的短板--因爲英特爾考慮未來要處理的是來自CPU、GPU 、AI加速引擎以及FPGA的數據,尤其是GPU在未來的數據處理中要扮演重要的角色,所以英特爾雖然有集成顯卡,但還是推出了全新架構的GPU。英特爾將這些數據處理器架構統稱爲XPUs。

“20年前,用於數據中心的GPU還不存在,XPU戰略的提出,在於我們意識到需要有不同類型的架構來服務於各種不同的工作負載。其中一些工作負載在本質上是標量的,另一些是向量、矩陣、空間等等。對應CPU、GPU、FPGA和其他的加速器,我們把這些都統稱爲XPU。”英特爾VP Jeff McVeigh在接受電子創新網等媒體採訪時指出,“我們的策略是將這些硬件類型、這些架構推向市場,然後將它們與oneAPI提供的通用編程結合起來,這就是XPU戰略的基礎。”

英特爾Xe GPU架構用一句話概括就是--一種架構通殺四方、適應AI、雲時代!對於Xe GPU架構,官方的定義是“並行矢量矩陣架構”,已經突出了這個架構的特點,那就是高度並行,適合擴展多種場景。Xe GPU架構有三大重點——軟件第一、並行第二,同時適應全新的工作負載,比如AI、視覺雲計算等等,這也是Intel作爲GPU後來的一個優勢,研發GPU架構的時候可以不用照顧太多之前的積累,直接面向未來潛力巨大的場景,比如AI、雲計算等等。

Xe架構GPU擴展爲四大級別,Xe_LP、Xe_HP、Xe_HPG和Xe_HPC,新增的HPG面向發燒級遊戲玩家,同時還支持硬件級實時光線追蹤加速,順便和NVIDIA、AMD的主流高端顯卡拼個“刺刀見紅”。

Xe_HP的封裝規模有1Tile、2Tile和4Tile三種,其中1Tile集成512組EU單元,每個EU爲8核,所以總計4096核心,以此類推,4Tile就是16384核,核心頻率可以達到1.3GHz。

Intel實驗室給出的測試成績顯示,4Tile的FP32(單精度)浮點性能居然達到了42TFLOPS,號稱目前單芯片全球第一。相較於1Tile的10588GFLOPS,放大比是3.993:1,比傳統意義上的雙芯顯卡、多卡互聯比起來,效率簡直誇張。

另外,雙十一蘋果發佈的MI號稱有超強的GPU 其實對比的不是這款GPU而是英特爾的集成顯卡。

關於英特爾11日發佈的全新服務器GPU:它是首款面向數據中心的獨顯產品,英特爾服務器GPU採用英特爾能效最高的圖形架構——英特爾Xe-LP微架構,擁有低功耗、獨立片上系統設計,並配備128比特管道和8GB專用板載低功耗DDR4顯存。

通過將英特爾服務器GPU和英特爾® 至強® 可擴展處理器強強聯合,服務提供商可在不改變服務器數量的情況下,單獨擴展顯卡容量,以在每個系統上支持更多流和訂閱用戶,並同時實現較低的總體擁有成本(TCO)。

通過新華三XG310 X16 PCIe3.0 GPU擴展卡——在3/4長、全高尺寸內封裝四顆英特爾服務器GPU芯片,即可在一個典型雙卡系統中支持超過100個安卓雲遊戲併發用戶。這一數量最高可擴展至160個併發用戶,實際數量取決於具體的遊戲和服務器配置。

開發人員可利用目前Media SDK中的通用API,這一API也將於明年遷移到oneAPI視頻處理庫當中。目前,英特爾正在與包括Gamestream、騰訊和Ubitus在內的諸多軟件和服務合作伙伴合作,共同將英特爾服務器GPU推向市場。

jeff認爲服務器GPU的一個重要應用就是Android雲遊戲,它在遊戲開發生態系統中佔據了74%的全球市場份額,未來有很大增長空間。“其另一個市場,是高密度的媒體轉碼和媒體編碼,例如有人拍了很多流行舞蹈的視頻,然後把它們上傳到網上,這些視頻像病毒一樣傳播開來,然後就有數百萬人想要做同樣的事,這就是我們所說的高密度媒體轉碼,所以服務器GPU主要關注這兩類用例(雲遊戲和流媒體服務器)”他舉例說,這個也是和阿里巴巴對GPU的未來需求分析一致。

其實這款GPU已經爲雲遊戲助力了,騰訊先遊雲遊戲助理總經理方亮表示:“英特爾至強可擴展處理器和英特爾服務器GPU,打造了一個高密度、低時延、低功耗、低TCO的解決方案,讓我們能夠在每臺雙卡服務器上生成超過100個遊戲實例,諸如《王者榮耀》、《傳說對決》。”

基於Xe-LP微架構的英特爾服務器GPU目前正在發貨。與近期推出的英特爾®銳炬® Xe MAX獨顯一道,該GPU將隨着英特爾Xe架構產品和軟件計劃的不斷深入發展進一步爲全球用戶提升視覺計算體驗。

二、 oneAPI實現軟件“大一統”

在我2019年採訪Raja Koduri時,他表示oneAPI旨在提供一個統一的編程模型,以簡化跨不同計算架構的應用程序開發工作,這些計算架構就是前面提到的標量處理器(CPU)、矢量處理器(GPU)、矩陣處理器(AI引擎)和空間處理器(FPGA),它們經常被縮寫爲SVMS,他表示英特爾的目標是將oneAPI打造成一個可跨多硬件架構開發的統一軟件平臺。

目前市場還未出現一種這樣的平臺,所以由oneAPI帶來的軟件“大一統”,可以堪稱是英特爾開創浩蕩PC時代之後的又一個傳奇。

4、oneAPI

oneAPI願景很美好,但是要實現挑戰極大。

從實際開發應用中看,針對不同的計算架構平臺都需要進行單獨的軟件投資,這些軟件投資涉及到了跨平臺的語言和庫,語言的庫的複雜性往往會導致產品開發週期變長。因此,英特爾oneAPI所要解決的就是在XPU與中間件/框架之間的語言和庫不統一 的問題。

在oneAPI項目當中,英特爾推出了一種基於標準的跨架構語言Data Parallel C++(DPC++)。據悉,DPC++支持不同硬件目標的代碼複用,是面向特定加速器的自定義調試的跨行業開放式解決方案,也是代替單一架構的專用語言。但DPC++卻並不是一種全新的開發語言。據瞭解,DPC++以C++爲基礎,融合了Kronos Group的SYCL,可支持數據並行性和異構編程,幷包含在一個開放社區流程中開發的語言擴展。

C++對於軟件開發者來說並不陌生,DPC++所融合的SYCL又是什麼?SYCL是一個免版稅的跨平臺抽象層,基於OpenCL的基本概念,可移植性和效率,使得異構處理器的代碼可以使用完全標準的“單一來源”風格編寫C++。

SYCL支持單一源代碼開發,其中C++模板函數可以包含主機代碼和設備代碼,以構建使用OpenCL加速的複雜算法,然後在不同類型數據的源代碼中重複使用它們。以此來看,DPC++並不是一件全新的語言,這對於軟件開發者來說,非常容易切入到oneAPI的項目中去。而爲了更易於軟件開發者的使用,英特爾在oneAPI beta版本中還插入了compatibility tool,通過此工具可以將之前的語言輕鬆轉換成DPC++。

另一方面,在oneAPI當中,英特爾還融合了多種庫,旨在加速以行業領域爲中心的主要功能,包含了數學庫、ML通信庫、視頻處理庫等。受到人工智能趨勢的影響,oneAPI中也包含了可面向所有開發人員的AI基礎套件。此外,英特爾還提供了優化的AI框架包,包含了TensorFlow、PyTorch等AI框架的工具套件。這些庫和框架都可以支持CPU、GPU、FPGA等多種計算架構。

所以,從語言到庫的構成上,不難看出oneAPI正在對跨架構平臺的軟件進行整合,以實現統一。

通過英特爾oneAPI工具包,開發者能夠使用一種通用、開放且基於行業標準的編程模型訪問英特爾XPU。這不僅能夠釋放底層硬件的性能潛力,同時能降低軟件開發和維護成本,並且在部署加速計算方面,英特爾® oneAPI工具包較在專用的、受限於特定廠商的方案風險更低。

此外,英特爾oneAPI工具包充分利用了先進的硬件性能和指令,如用於CPU的英特爾®AVX-512(高級矢量擴展)和英特爾®深度學習加速(英特爾® DL Boost),以及XPU獨有的功能。

不過,這還不夠,更重要的是

生態

要讓一個新的架構被產業接受,必須有強大的生態系統做後盾。

關於未來oneAPI生態的構建,英特爾相關人士表示,公司將不僅繼續與上下游合作伙伴之間展開合作,也會將oneAPI納入到與高校的合作當中。在英特爾看來,目前,衆多高校已經開設了C++相關課程,oneAPI中的專用開發語言以C++爲基礎,適合相關專業的學生的繼續學習和發展。其次,現在產教之間的融合越來越緊密,許多高校已經開展了異構方面的研究,oneAPI會幫助他們更快地從理論過渡到實踐。

另外,oneAPI也已經得到了業界的支持,近期微軟Azure和谷歌的TensorFlow已經宣佈支持oneAPI;衆多領先的研究機構、公司和大學也支持oneAPI。

除此之外,伊利諾伊大學香檳分校的貝克曼高級科學技術研究所還宣佈將建立一個新的oneAPI卓越中心(CoE)。他們正在使用oneAPI編程模型將生命科學應用程序NAMD擴展到其他計算環境。NAMD能夠模擬大型生物分子系統,正在幫助解決諸如COVID-19這樣的全球性挑戰。這個卓越中心將和研究GROMACS的斯德哥爾摩大學(SERC)卓越中心,以及海德堡大學(URZ)卓越中心一道,共同研究如何爲其它廠商的GPU提供oneAPI支持。

Raja表示oneAPI不僅支持英特爾的硬件產品,也將支持其他第三方產品,所以這並不是一個私有的平臺,而是一個面向產業開放的平臺,“oneAPI零級別(Level Zero)是開源的。它不僅是爲了英特爾異構的XPU,它也是一個直接的接口,讓人們可以充分釋放硬件的每一份性能。開發者可以通過特定的編程來實現最出色的性能。這是Level Zero的目的。”他指出,“從整個系統上看,在所有XPUs上實現的Level Zero的都是通用的。”

30年前,英特爾通過打造PC產業標準平臺開創了PC時代,在數據時代,提倡“軟件先行”的英特爾看到了軟件的重要性,打造了oneAPI,這個跨平臺的軟件平臺未來可以支持更多的硬件開發,必然會吸引更多的夥伴加入進來,共同掘金數據時代。

一個浩浩蕩蕩的新時代就要開啓了,十年後,我們看看誰是真正的王者!

最後,一圖回顧下英特爾五年來的技術發展之路

作者:張國斌

來源:電子創新網

相關文章