雷鋒網消息,2018年11月21日,NVIDIA在蘇州舉辦了GTC China大會。四方趕來的與會者對這場在中國舉辦的技術大會倍加期待,希望黃仁勳在這場技術盛會上能爲中國市場帶來新鮮勁爆的消息。

  10點整,一身職業皮夾克裝的黃教主準時登上了演講臺,其強大的個人魅力瞬間引來了全場的歡呼和掌聲。

  RTX系列顯卡demo:遊戲畫面表現力達到新高度

  作爲一家以高性能計算著稱的GPU企業,黃仁勳首先介紹了其全新RTX系列圖形處理器的強大能力。

  黃仁勳在現場宣佈與網易建立技術合作,其網絡遊戲《逆水寒》將成爲國內首款應用實時光線追蹤技術的遊戲。

  現場還實時演示了《逆水寒》的全新技術demo,依託RTX顯卡的全新技術和強大性能,遊戲的畫面表現力達到了一個新高度。在開啓RTX之後,遊戲的光影的渲染有了脫胎換骨的飛躍,湖面的波光、金屬的反射都處理的更加真實,虛擬的世界變得更加鮮活。

  除了實時光線追蹤,《逆水寒》也將同時支持基於AI的DLSS高性能抗鋸齒技術,黃仁勳表示DLSS可帶來1.8倍性能提升。

  GPU加速平臺HGX-2

  RTX之後,黃仁勳還在現場介紹了其早前發佈的GPU加速平臺HGX-2。HGX-2由NVIDIA的16個高端V100 GPU組成,使用NVSwitch高速互聯總線將16個GPU完全連接爲一個整體來使用,其能在單節點中提供2PFLOPS計算性能。

  作爲雲服務器平臺,HGX-2具備多精度計算能力,支持面向科學計算和模擬的高精度FP64和FP32計算,也支持AI訓練和推理所用的FP16和INT8精度。與僅使用CPU的服務器相比,它將AI機器學習工作負載的運行速度提升近550倍,將AI深度學習工作負載的運行速度提升近300倍,將高性能計算工作負載的運行速度提升近160倍。

  黃仁勳提到,浪潮是中國首家構建HGX-2服務器的廠商,浪潮AI超級服務器AGX-5專爲解決當前AI深度學習和高性能計算的性能擴展難題而設計。此外,包括百度、騰訊、阿里巴巴在內的諸多客戶,也在藉助HGX-2爲內部應用及雲客戶提供一系列更強大的AI服務;聯想、華爲、曙光也已宣佈成爲HGX-2雲服務器平臺的合作伙伴。

  T4雲計算卡

  緊接着,黃仁勳還介紹了其T4雲計算卡。T4基於全新 NVIDIA Turing架構,採用多精度Turing Tensor Core和全新RT Core,與加速的容器化軟件堆棧相結合,T4的多精度功能可支持4種不同精度等級的各類AI工作負載,助力實現突破性的AI性能,FP32精度能夠提供8.1TFLOPS,FP16精度能夠提供65TFLOPS,INT8精度能夠提供130TOPS,INT4精度能夠提供260TOPS。

  憑藉其強大的加速能力,百度、騰訊、京東和科大訊飛將開始使用Turing雲GPU加速超大規模數據中心;浪潮、聯想、華爲、曙光、浪潮商用機器和新華三均宣佈推出基於全新T4的服務器。

  黃仁勳在現場演示了基於百度圖片識別引擎的demo,在使用Intel Skylake架構的純CPU服務器時,運算速度只有4~5fps,而換用4塊T4計算卡後,運算速度飆升至6200fps。在將計算卡數量增至28塊時,運算速度也呈線性增長至43500fps,可見其可擴展性非常優秀。

  開源GPU加速平臺Rapids

  在詳細闡述完上述計算加速硬件後,黃仁勳還簡要推介了其開源的 GPU 加速平臺 Rapids,該平臺於今年10月發佈,是一款針對數據科學和機器學習的GPU加速平臺,爲數據科學家提供標準化的流水線式工具,數據處理速度較僅用CPU提升50倍。

  RAPIDS構建於Apache Arrow、PANDAS和SKLEARN等組件之上,通過CUDF數據過濾、CUML機器學習、CUGRAPH數據圖像化來加速處理數據,爲最流行的Python數據科學工具鏈帶來了GPU提速。

  這三套軟件工具都是基於CUDA開發,可以把它們看成是CUDA的一部分。其中CUDF與Pandas的功能非常類似,Pandas的所有功能都可以在CUDF裏找到對應的API;CUML則對應SKLEARN,無論是分類、聚類、迴歸等算法都可以在CUML裏面找到。而CUGRAPH目前尚未正式推出,預計會在明年正式集成到RAPIDS中。

  黃仁勳介紹到,平安科技最近對RAPID進行了試用,這是一個GPU加速的新開源平臺,適用於大規模的數據分析和機器學習,讓數據科學家首次能夠在GPU上運行數據科學管線,並大幅縮短數據集處理時間。

  平安科技使用RAPIDS以及GPU加速的PCA和DBSCAN之後,工作流程執行速度加快了80倍,從幾天縮短到幾小時(包括數據加載和訓練時間),這有助於該公司主動做出預測並完善預防計劃。

  中國最大的基因公司華大基因同樣擁有超過1PB的海量數據存放在數據庫中。華大基因使用一種名叫XGBoost的機器學習算法,對用於癌症患者個性化免疫治療的靶向多肽進行分類。他們隊在NVIDIA DGX-1 AI超級計算機 超級計算機上運行RAPIDS平臺,將分析速度提高了17倍,並將多肽的分析範圍擴大至數百萬種。

  自動駕駛:關鍵詞“車規級”和“全面量產”

  最後壓軸出場的則是被NVIDIA寄予厚望的Jetson AGX Xavier AI計算平臺。Xavier是世界首個用於自主機器的AI計算平臺,在Xaiver基礎上,NVIDIA打造了一個全新的產品家族DRIVE AGX,目前兩大主力產品爲基礎的DIRVE AGX Xaiver和高性能的DRIVE AGX Pegasus。

  目前,中國很多初創汽車企業、貨運公司和領先的供應商爲其即將推出的自動駕駛系統平臺選用NVIDIA DRIVE AGX開發套件。一汽集團(FAW Group)是中國最大的卡車製造商之一,正在與自動駕駛初創公司智加科技(PlusAI)和物流公司滿幫集團(Full Truck Alliance, FTA)合作開發無人駕駛商用卡車車隊,計劃於2021年進行大規模部署。

  據悉,一汽集團將採用運算能力高達每秒320萬億次的AI超級計算機NVIDIA DRIVE AGX Pegasus,爲其即將推出的自動駕駛卡車的運行提供支持,並加速中國長途運輸行業的升級。

  除了汽車製造商之外,Weride.ai、Momenta、圖森未來、AutoX以及Roadstar.ai等自動駕駛初創企業也更傾向於選擇。目前爲止,有超過370家公司在自家自動駕駛生態系統中使用NVIDIA DRIVE AGX Xavier平臺。

  總部位於中國廣州的初創公司小鵬汽車將使用DRIVE AGX Xavier,致力於在2020年打造面向量產車型的L3級自動駕駛系統;SF Motors也計劃於明年推出其首款電動分頻器SF5,並表示將採用DRIVE AGX Xavier開發下一代自主計算平臺。此外DRIVE AGX Xavier還爲奇點汽車即將推出的車輛提供技術支持,期望於2020年實現量產L3級自動駕駛產品。

  爲了展示NVIDIA自動駕駛芯片的強大算力,黃仁勳在現場放出了搭載Pegasus的NVIDIA無人車在硅谷的高速道路上進行了一段實地路測。

  在這段總長度爲50英里的路測中,駕駛員全程都未觸碰方向盤,由無人車自行完成了所有的行車操作。從車上的實時影像可以看出,Pegasus支持的無人車對車道線、標誌、各類道路參與者進行實時的識別、分割、追蹤,感知效果相當強大。

  同時,京東、美團、菜鳥等電商巨頭的人工智能配送機器人,均搭載了NVIDIA Jetson AGX Xavier開發者套件。雖然配送車及其電池的尺寸較小,但傳感、定位和路徑規劃所需的處理量與大型無人駕駛車輛相同,且很大程度上依賴於Jetson AGX Xavier 的高性能計算。

  此外,Jetson AGX Xavier平臺還配備了NVIDIA JetPack SDK。這套完整的AI開發軟件解決方案,涵蓋了最新版本的CUDA、cuDNN和TensorRT,以及用於簡化並加速開發的高級軟件代碼。基於此,由軟件定義的配送機器人等自主機器,完全可以通過線上更新完成性能提高及添加功能等工作。

查看原文 >>
相關文章