原標題:Cadence國內展示兩款AI芯片IP,瞄準自動駕駛/安防/AI語音

智東西(公衆號:zhidxcom)

文 | 心緣

智東西11月13日消息,今天,全球芯片及電子系統設計自動化(EDA)軟件巨頭Cadence首次在國內發佈Tensilica系列的兩款新品: Tensilica DNA 100處理器IP和Tensilica HiFi 5音頻/語音數字信號處理器IP。此前,DNA 100於9月19日在德國發布,HiFi 5 DSP於10月31日在美國發布。

其中,Tensilica DNA 100是Cadence首款深度神經網絡加速器AI處理器IP,將於今年12月向部分客戶提供,預計明年第一季度全面上市。Tensilica HiFi 5 DSP是Cadence首款爲高性能遠場處理和AI語音識別處理量身優化的IP核,在基於神經網絡的語音識別算法上提供高達4倍的改進。

Cadence公司IP事業部Tensilica資深產品總監Lazaar Louis、Cadence公司IP事業部Tensilica技術營銷總監Yipeng Liu來到中國,與Cadence公司亞太區IP業務總監陳會馨一同介紹了兩款新品。

一、首款深度神經網絡加速器AI處理器IP

Tensilica DNA 100處理器是Cadence首款深度神經網絡加速器(DNA)AI處理器IP,具有靈活可擴展的特點,能夠滿足小到0.5大至數百TeraMAC(TMAC)的各種需求的擴展,爲終端側(on-device)AI提供高性能與高能效。

以汽車動力等應用爲例,汽車擁有大量傳感器,包括雷達、攝像頭、激光雷達和超聲波等,對推理性能需求越來越高。標準DSP主要用於做信號處理,而數據相關任務將被移交給神經網絡加速器,比如DNA 100就負責處理感知和決策制定任務。

Cadence表示,較其他採用相似陣列尺寸大小的乘法累加運算(MAC)解決方案,DNA 100處理器性能提升達4.7倍,在功率方面每瓦特性能提升高達2.3倍。

神經網絡(NN)的特徵在於權重和激活的固有稀疏度,加載和乘以零會造成其他處理器中不必要的MAC消耗。

DNA 100處理器的專用硬件計算引擎移除了上述兩項任務,只計算非零激活和權重,利用稀疏度提高能效並降低計算量。

神經網絡再訓練有助於增加網絡中的稀疏度,並通過DNA 100處理器的稀疏計算引擎實現更高的性能。

DNA 100處理器能夠利用更小的陣列實現最大吞吐量。例如,在4K MAC配置環境下,ResNet 50推理性能預計能實現高達每秒2550幀(fps)和3.4TMAC/W(在16nm工藝),而競爭對手只能達到每秒538幀。

DNA 100處理器非常適用於自動駕駛汽車、ADAS、安防監控、機器人、無人機、AR/VR、智能手機、智能家居和物聯網領域的設備端NN推理應用。

此外,DNA 100處理器還配備了完整的AI軟件平臺,兼容最新版本的Tensilica神經網絡編譯器,支持Caffe、TensorFlow等多種AI框架,Cadence最近還宣佈它將支持Facebook的跨硬件平臺機器學習編譯器Glow。

Tensilica神經網絡編譯器利用一套全面優化的NN庫函數,將任何NN映射爲可執行和高度優化的高性能代碼。因此,DNA 100處理器具有支持分類、對象檢測、分割、重複和迴歸等多種不同網絡類型的軟件生態系統。

DNA 100處理器還支持Android神經​​網絡(ANN)API,用於Android設備中的設備AI推理。

DNA 100處理器在所有NN層運行,包括卷積、完全連接、LSTM、LRN和池化。單個DNA 100處理器可以輕鬆地從0.5擴展到12個有效TMAC,並可以通過堆疊多個DNA 100處理器以實現數百TMAC,可用於最計算密集型設備端的NN應用。

爲了以防DNA 100處理器內部硬件引擎當前不支持的新NN層,DNA 100處理器還集成了Tensilica DSP,同時使用Tensilica指令擴展(TIE)指令提供Tensilica Xtensa核心的可擴展性和可編程性。

由於DNA 100處理器擁有獨立的直接存儲器訪問(DMA),因此無需新增控制器即可運行其他控制代碼。

DNA 100處理器將於2018年12月面向部分客戶提供,預計2019年第一季度將全面上市。

二、首款爲高性能遠場處理和AI語音處理而優化的IP核

Tensilica HiFi 5音頻/語音數字信號處理器(DSP)IP是 Cadence Tensilica HiFi DSP系列的新品,也是Cadence首款爲高性能遠場處理和AI語音識別處理量身優化的IP核,該產品主攻市場有智能家居、汽車車載、藍牙耳機等。

與HiFi 4 DSP相比,這款HiFi 5 DSP爲音頻處理提供了2倍的計算能力,爲NN處理提升了4倍的計算能力。

Tensilica HiFi DSP系列是全球最廣泛使用的音頻/聲音/語音處理器,截至目前在全球有超過125家生態合作伙伴,Tensilica HiFi DSP每年出貨量超過10億。

HiFi 5 DSP的關鍵特性包括:

1、採用5個超長指令字(VLIW) 插槽架構,支持每循環發佈2個128-bit負載。

2、對比HiFi 4 DSP,預處理和後處理的MAC性能提高2倍,包括支持每週期8個32×32-bit MACs或16個16×16-bit MACs,可選每週期8個單精度浮點MACs。

3、對比HiFi 4 DSP,NN處理MAC性能提高4倍,包括每週期32個16×8或16×4 MACs、可選每週期16個半精度浮點MACs。

4、全新HiFi NN庫爲NN處理(尤其是語音任務)提供了一組專門優化的庫函數。這些庫函數可以輕鬆集成到主流機器學習框架中集成。

5、完全兼容HiFi產品線擁有的超過300個HiFi優化的音頻語音編解碼器以及語音增強軟件包。

此外,Cadence還會提供Tensilica HiFi DSP NN庫等一系列軟件。

隨着語音助手的普及,語音控制用戶界面對智能產品製造商們愈發重要,他們需要更先進的DSP算法以消除噪音並隔離揚聲器的聲音干擾。此外,因爲對延遲、隱私問題的擔憂,基於神經網絡的語音識別算法更多是在本地而非雲端來執行任務。

爲了應對在能耗敏感型設備上搭載NN遠場處理和語音識別算法帶來的計算挑戰,Ambiq Micro成爲Cadence HiFi 5 DSP的第一家被授權方。

結語:邊緣計算升溫帶動行業智能

在AI的浪潮之下,邊緣設備的AI處理器應用快速增長,但更低的延遲、更好的隱私、更快的處理速度、更自然的語音UI交互等各種越來越高的需求正在增加設備上的處理工作負荷。

針對智能產品滋生的痛點,Cadence正在以其獨特的優勢深入AI市場,爲圍繞着視覺和語音處理的邊緣AI推理和應用提供更多底層的助力,在AI行業中扮演越來越重要的角色。

查看原文 >>
相關文章