原標題:王者榮耀:探索和發展通用AI問題

生物體的進化速度需要數百萬年才能計算出來,而人工智能的進化速度是肉眼可見的。

圖片來自網絡

半百年前,人類需要用一臺重達1270公斤的電腦來對抗象棋大師時,根本沒有想到過半個世紀後,王者榮耀的AI可以進化到職業電競水平,這就是王者榮耀的AI——“絕悟”,它可以模仿玩家離線對局的樣本,爲了突破上限,又採用了AI自對局的強化學習,然後在“絕悟挑戰”中測試強度。

《王者榮耀》執行製作人、騰訊天美L1工作室總經理黃藍梟在STAC首屆科創聯誼會上表示,“絕悟”是一個多智能體系統,即大量能夠自主決策的AI共同協作,以實現一個共同且具有挑戰性的目標。

此外,王者榮耀團隊還開放了王者的核心機制,與騰訊AILab、相關高校、研究機構等合作,對多主體進行研究。希望通過這些研究成果,能夠在其他行業領域推廣應用,爲工業機器人、救災機器人等提供幫助。

圖片來自網絡

做王者榮耀AI的前沿研究。

多元智能系統統(大量具有自主決策能力的AI共同協作,以達到同一目標)是前沿人工智能技術的核心研究領域,經過多年的研究,已被廣泛應用於各行各業。例如無人倉庫,多智能體機器人完成大規模倉庫管理;智能交通車輛協同系統,實現無人駕駛;智能工業機器人,物聯網等領域。而多代理技術都能很好地應用下來提高生產效率。

在遊戲研發過程中,王者榮耀團隊發現MOBA遊戲機制具有很強的多人協作性,在非對稱信息下的遊戲空間很大,合作競技性很強,非常適合於採用多代理人工智能技術來提高生產和測試效率。

如果AI技術能夠學習人類在如此複雜的環境中實時感知、分析、理解、推理、決策和行動,它將在變化的、複雜的現實環境中扮演更重要的角色。

基於這一背景,基於王者榮耀遊戲的特性,王者榮耀團隊與騰訊AILab合作,在王者繼續進行人工智能相關的技術研究和應用實踐,研究並開發出多智能體產品“絕悟”。

使AI學會像人一樣做出決定。

圖片來自網絡

“絕悟”這個名字的寓意是“絕悟”,它的技術研發始於2017年,並於2018年12月通過了頂級業餘水平測試。

在2019年8月2日于吉隆坡舉行的王者榮耀冠軍盃半決賽特設環節上,“絕悟”以5v5職業選手賽區聯隊帶來的水平測試獲勝,升級到王者榮耀電競職業級別。

與之相比,“絕悟”1v1版也首次公開亮相,在上海舉行的國際數碼互動娛樂展上,ChinaJoy向頂級業餘玩家開放了爲期四天的體驗測試。在爲期4天的2100場考試中,“絕悟”只輸4場,勝率達99.81%。

職業描述AI打王者榮耀的場景是——非完全信息多智能體協同零和即時遊戲。簡單地說,AI需要在信息不完全、複雜性高的情況下做出複雜而快速的決策。

圖片來自網絡

10個參與者面對着一幅信息不全的巨大地圖,其中包括戰略規劃、英雄選擇、技能運用、路徑探索和團隊合作,這些都給他們帶來了極其複雜的情況,其中預期可能發生10的20000次方種操作,而整個宇宙原子總數只有10的80個方種操作。

從王者本身的實踐層面上,玩家可以在限時開放的「絕悟」挑戰中體驗AI的能力,在遇到隊友掉線時,也可以把掉線的隊友交給AI託管,但是AI並不能主宰比賽,勝負的決定權仍掌握在所有玩家手中,此外,「絕悟」只在實驗室環境下才能使用。

“絕悟”也在新英雄設計和遊戲數值調整中起到了重要作用,爲AI最終探索遊戲打法和勝率提供參考,幫助規劃優化遊戲設計。

在2020年11月的一次平衡調整中,王者團隊想要提高公孫離的強度,“絕悟”對調整後的公孫離進行了模擬對戰,結果顯示改變後的勝率+2.42個百分點,但部分體驗服玩家認爲這將嚴重削弱公孫離。

圖片來自網絡

由“絕悟”到“開悟”

經實踐驗證,王者榮耀與騰訊AILab團隊開放了多智能體研究過程中所沉澱下來的技術資產,建立了開悟開放平臺,打造了以王者榮耀核心技術爲支撐,面向用戶低成本進行多智能體算法研究、教學和驗證的教學科研平臺。

他說:“我們開放王者的核心機制,提供標準界面、核心算法、脫敏訓練、評估工具和計算集羣等,讓教師和同學進行多智能體機器學習算法研究,交流學習結果,對算法結果進行反覆迭代升級。將來還可以提供給其他有需要的研究機構進行更接近工業化進程的研究,”王者榮耀執行製作人、騰訊天美L1工作室總經理黃藍梟說。

到2020年,王者榮耀將與騰訊AILab、騰訊大學、騰訊遊戲學院共同舉辦首屆“王者榮耀·開悟AI+遊戲大賽”,邀請18所頂尖大學的老師和同學在“開悟AI+遊戲大賽”上進行學術研究和交流,並提供全方位的資源支持。

"多個智能體相互學習協作是很困難的,需要確定每個智能體的目標,並劃分主輔關係,實現這樣複雜的設計成本很高。"中國科學院自動化研究所興軍亮團隊提出了一個自我提升式強化學習框架,智能體可以先通過模仿學習,再通過自我互動而進階進化,再加上他們提出的一個新策略,可以有效地緩解多智能學習中的常見問題。

通過一年的實踐,活動取得了良好的成果,驗證了王者榮耀在遊戲環境中人工智能技術賦能的思路。

圖片來自網絡

助產學,共享AI+遊戲新生態。

《王者榮耀》製作人、騰訊天美L1工作室總經理黃藍梟在STAC首屆科創聯誼會上宣佈,將與國內頂尖大學共同建立“多智能體人工智能科研教學聯盟”,爲更多的高校教師和學生賦能,爲教師、學生和業界夥伴提供低門檻、內容豐富且穩定可靠的學術研究和交流場景,這一場景將在國內高校中率先展開。

“人工智能是國家的重大戰略,騰訊遊戲公司副總裁、騰訊遊戲學院院長夏琳表示,騰訊遊戲公司將與各高校進行深度產教融合,重點培養AI+遊戲的新興科技人才。

與此同時,聚焦王者榮耀等遊戲AI領域的科研,與國內外重點大學和國家重點實驗室不斷輸出對行業有價值的科研成果,AI將在國內持續發展,未來可期。

隨着人類與科技的交融,王者榮耀不斷地投入,讓AI由0到1去學習進化,並發展出一套合理的行爲模式,其中的經驗、方法和結論,短期內可以爲遊戲業、電競業帶來直接的推動和幫助,有望在更大範圍內產生更深遠的影響,如醫療、製造業、無人駕駛、農業、智慧城市等。從長遠來看,AI+遊戲的研究,將推動AI的最終目標——探索和發展通用AI問題。

相關文章