人工智能經歷了六十多年的浮浮沉沉,隨着計算算力的進步,算法的創新和互聯網發展下的海量數據積累,人工智能技術未來十年將煥發出新的活力,成爲最具有衝擊力的科技發展趨勢之一。

電信網絡作爲信息通信的基礎設施,具有應用人工智能技術的巨大空間和潛力。如何利用人工智能算法提供的強大分析、判斷、預測等能力,賦能網元、網絡和業務系統,並將其與電信網絡的規劃、建設、維護、運行和優化等工作內容結合起來,成爲電信業關注的重要課題。

在HUAWEI CONNECT 2020期間,華爲基於對電信領域的深刻理解和多年經驗沉澱,帶來了《雲地協同加速網絡AI規模商用使能實現自動駕駛網絡》的分享,旨在結合電信領域應用場景,使能網絡達到自動、自愈、自優和自治的自動駕駛網絡,提升整個網絡的效率,降低OPEX。

電信行業面臨挑戰呼喚ADN

我們正進入一個跨界競爭的新時代,每個行業都面臨着結構性挑戰,電信行業尤其如此。新趨勢下,電信網絡正面臨以下三大挑戰:

業務複雜:網絡所聯接的業務越來越多,無人機、汽車、AR/VR…從B2C到B2C、B2X,網絡所支撐的業務越來越複雜;

運維複雜:從4G到5G,2-3-4-5四代同堂,十餘種網絡協議,數千網絡特性,上萬配置參數,網絡運維複雜度激增;

聯接複雜:萬物智能,使得聯接密度增加了100倍,聯接移動性達到了150km/h,聯接的數據量增加1000倍,聯接複雜度前所未有;

要解決電信網絡面臨的挑戰,僅僅靠產品創新遠遠不夠,需要整個系統架構創新和商業模式創新,才能提升運營商的競爭力,解決結構性問題。從2018年開始,爲實現網絡自動化和智能化,電信行業組織、運營商和設備商紛紛啓動技術探索。

華爲在2018年即提出電信行業邁向ADN五級演進標準,爲實現自動駕駛網絡提供了參考。另外,以中國聯通、中國移動、BT、法電、Telstra爲代表的運營商,以及以華爲、愛立信爲代表的設備供應商均積極開展相關實踐,網絡智能化、自動化成爲行業熱點。

近10年來,華爲從ALL IP,ALL Cloud進入ALL Intelligence時代,在架構創新的道路上從未停止。2019年4月,華爲正式發佈iMaster NAIE網絡AI雲服務,爲華爲網絡智能化戰略實施的的重要里程碑。

不僅如此,華爲自動駕駛網絡(ADN)秉承“把複雜留給自己,把簡單帶給客戶”的思想,以網絡極簡和智能運維爲核心理念規劃、設計和開發產品,通過雲端+AI、網絡+AI和網元+AI的三層AI開放架構“給網絡以智能,給運維以平臺”,加速電信運營商數字化和智能化轉型。

雲地協同加速AI特性規模應用

近年來,全球業界各方在網絡AI方面紛紛進行積極的探索和實踐,經過驗證在運維效率、能耗效率、網絡資源利用率以及用戶業務體驗提升等方面確實能夠帶來價值,電信產業走向智能化已經成爲整個行業的共識。但在實踐中,也發現網絡AI在走向規模化工程應用的過程中存在很多挑戰,如模型重訓練佔用資源多、模型版本升級管理難度大、本地樣本少、模型精度不夠等問題。

模型重訓練佔用資源多:從實踐統計來看,一些場景都會發生因泛化、或數據偏移而導致的模型精度下降問題,如無線流量預測、DC PUE優化等,AI模型都需要進行重訓練。AI模型訓練一般會佔用較多系統資源,如在網元或網管實施重訓練任務,訓練效率低,同時也可能會影響設備性能。

模型版本升級管理難度大:很多場景的AI模型都是一站一模型,如無線基站智能節能等,各站點的模型都根據本地化數據進行定製化訓練。各局點模型版本不同,升級頻度也不同,成千上萬的站點模型,管理難度很大。需要有一個統一的平臺,高效實現模型狀態的監控和版本升級策略等管理任務。

本地樣本少、模型精度不夠:部分場景單局點樣本量少,不足以支撐模型訓練,如核心網KPI異常檢測,單局點發生異常頻率很少,訓練需要的樣本量不夠。因此,需要能夠匯聚所有局點的全量樣本信息,可能還需輔以聯邦學習等技術,才能訓練得到滿足業務精度要求的AI模型。

雲地協同實現架構

針對以上問題,華爲提出雲地協同創新方案,通過雲地協同,可以加速AI特性的規模部署。

雲地協同,是指雲端和地端一起協作完成數據樣本上雲,模型狀態管理,模型重訓練,模型/知識下發、擇優更新等一系列的閉環任務,同時把雲端彙集的全局網絡知識經驗、全量數據訓練得到的高精度模型,持續注入地端,讓電信網絡能夠進行智能的迭代升級,變得越來越聰明。

雲地協同有三個主要的特徵:一是雲端和地端要有通道;二是地端到雲端,信息可以從運營商上傳到雲端,包括數據樣本、模型狀態、以及重訓練請求等信息,三是雲端到地端可以下發新的模型,同時網絡知識庫裏的知識也可以注入到地端。

雲地協同機制參見下圖:

雲地協同三個階段

據介紹,雲地協同在實際應用部署時有三個階段,針對不同場景可以選擇適合的階段,最終大幅提高網絡的資源效率。

階段1:雲端進行初始模型的訓練,運行態由地端根據新增的樣本進行在線學習,持續保持模型的精度。這種模式主要是適用於模型相對簡單,算法結構比較穩定的場景,這種場景一般不需要對模型結構和算法本身進行更改,只需要根據本地數據進行在線學習,優化調整模型參數。比如像核心網變更在線機器值守等。

階段2:雲端進行模型的分發,然後在地端根據新增樣本進行在線學習。具體講,就是雲端會持續對模型進行優化,包括模型算法結構上的,優化後的模型會進行推送到地端,地端根據評估結果進行模型擇優更新。同時,地端也會根據本地數據樣本的學習進行模型參數的優化。這種一般適合於模型相對複雜,華爲會持續進行模型算法結構優化的場景,比如無線KPI 異常檢測等。

階段3:雲地實時協同,模型可以自動化演進,具體講就是本地樣本會實時上傳到雲端,雲端進行訓練和優化後的模型會自動推送到地端,地端進行模型評估擇優進行升級。這種主要是適用於模型複雜、需要用到華爲雲端高質量標註數據,知識圖譜以及仿真等知識能力進行模型優化的場景,比如IP RAN/PTN智能告警,DC PUE優化等。

雲地協同關鍵價值

聯邦學習,即通過匯聚各個地端模型的參數,在雲端採用匯聚算法,形成效果更好的共享模型,再下發給各個地端進行使用,其最大的特點,就是在地端數據不用出局的情況下,提升模型的精度。藉助聯邦學習可以更好的實現雲地協同,從而提升模型泛化能力和訓練效率。

藉助知識圖譜,通過沉澱專家經驗和產品知識轉化形成故障傳播關係等,形成“網絡知識庫”,可用於故障運維輔助、知識問答等。

在雲端仿真方面,通過在雲端構建虛擬仿真環境,高效安全地進行模型或業務驗證,在避免現網性能或KPI受到影響的同時,支撐網絡問題的快速閉環。

模型因爲需要進行更新,更新的方式如果採用傳統網管集成的這種模式,需要經過多層多次的人工動作,首先模型版本發佈後,需要產品研發把模型通過代碼工作集成到網管軟件版本里,然後發佈到華爲Support網站。

如果採用自動升級模式,通過雲地協同,讓AI模型市場跟地端網絡AI對接,模型發佈後進行推送,讓地端局點啓動自動化的模型升級,當然升級前也會完成模型的評估,整個過程在1個小時即可完成。

總結來看,雲地協同可以實現一點生效,全網複製,AI的特性在一個局點成功實施後,快速的形成知識和經驗,在其他局點進行復制,實現在全網規模應用。

華爲iMaster NAIE讓網絡AI開發簡單高效

NAIE是自動駕駛網絡解決方案的網絡AI設計和開發平臺,由數據服務,訓練服務,AIOps使能服務,推理框架和生態服務五大部分組成。

網絡AI模型開發既要懂AI、又要懂網絡,技術門檻高。模型開發過程中,既需要懂AI知識,又需要熟悉網絡業務。電信領域專家AI積累少,可借鑑經驗少。而且由於AI算法多,選擇範圍廣,所以導致試錯成本高、開發效率低;算法科學家不懂電信業務,需要花大量時間瞭解學習。模型訓練依賴大量並且昂貴的計算資源,調參優化週期長,訓練耗時高、週期長。

NAIE訓練平臺,提供一站式高效模型訓練,集成業界通用的主流AI算法框架,包括Mindspore、Tensorflow、SParkML、Caffe2、MXNet等,內嵌華爲在網絡領域30多年的知識和經驗沉澱,支持電信領域的特徵處理,輔助快速識別等關鍵特徵,內置電信領域AI典型算法,如異常檢測、根因分析、優化控制、業務預測等,支持模型快速驗證。目前主要包括三類服務:模型訓練服務、模型生成服務和通信模型服務(在線推理),可以滿足不同層次的人員對於模型開發的需求。

不僅如此,華爲還提供了豐富的NAIE培訓服務,線上線下結合,助力運營商人才轉型。

總結

未來是智能化的時代,運營商網絡智能化不可能一蹴而就,而是一個長期實踐。華爲自動駕駛網絡解決方案是華爲All Intelligence戰略在電信領域的落地,而iMaster NAIE做爲智能化部件,將使能自動駕駛網絡。核心的AI能力依託華爲在All Intelligence中長期堅決的戰略投入而積累成長,和電信領域場景想結合,幫助運營商儘快實現數字化,智能化轉型。

相關文章