"\u003Cdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002F2d6fe1c1826f4cf890757d28e255888a\" img_width=\"850\" img_height=\"400\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002Fb68acb5a3ae24a509faec6da2aaf1ec8\" img_width=\"1080\" img_height=\"393\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp\u003E智東西8月3日消息,昨夜,騰訊策略協作型 AI “絕悟”再出山,對戰王者榮耀職業玩家,\u003Cstrong\u003E勝率相當驚人。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E在當晚吉隆坡舉辦的王者榮耀最高規格電競賽事——世界冠軍盃半決賽的特設環節中,\u003Cstrong\u003E在職業選手賽區聯隊帶來的 5v5 水平測試中獲勝,升級至王者榮耀電競職業水平。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E同時,“絕悟”的 1v1 版本也在上海舉辦的國際數碼互動娛樂展覽會 ChinaJoy 首次對公衆亮相,並向頂級業餘玩家開放爲期四天的體驗測試。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E在首日的 504 場測試中,“絕悟”測試勝率爲 99.8%,\u003C\u002Fstrong\u003E僅在對方爲王者榮耀國服第一后羿的情況下,輸 1 場。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002F45aba0b34ce044b8a950e742800d5d87\" img_width=\"800\" img_height=\"398\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp\u003E當年 AlphaGo 打敗世界圍棋冠軍李世石,直接引爆第三次 AI 浪潮。但與現實世界相比,它解決的問題只是九牛一毛。\u003Cstrong\u003E更爲複雜的即時策略遊戲(RTS)正成爲研究人員們新的挑戰項目。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E業界普遍認爲,\u003Cstrong\u003E從這些策略遊戲中有望誕生下一個 AI 里程碑。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E其中最受歡迎的分支是 MOBA 遊戲。像谷歌 DeepMind(星際爭霸2)、Facebook(星際爭霸2) 及 Open AI(Dota 2)等 AI 界明星團隊都在推進此類研究。\u003C\u002Fp\u003E\u003Cp\u003E騰訊也早在兩年前就透露在做 AI 打王者榮耀方面的研究。去年12月,5個相互的獨立的 AI 在學會開黑技能後,5v5對陣王者榮耀中王者段位的人類玩家。大戰 250 個回合後,AI 拿下 48% 的勝率,幾乎與人類打成平手。\u003C\u002Fp\u003E\u003Cp\u003E最新這場人機大戰究竟戰況如何?其背後的技術又如何實現?本文將簡要介紹這場人機大戰背後的技術,覆盤全場精彩時刻,並回顧騰訊 AI 探索智能體研究的相關進程。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F1259a82cf8874b7fac334dc78a9637bf\" img_width=\"636\" img_height=\"168\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Ch1 class=\"ql-align-center\"\u003E\u003Cstrong\u003E無需人類數據,一天訓練強度高達人類440年\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E“絕悟”名字寓意絕佳領悟力,其技術研發始於 2017 年 12 月。一年後,“絕悟”通過了由前職業選手與主播聯隊帶來的頂尖業餘水平測試。\u003C\u002Fp\u003E\u003Cp\u003E在本次測試中,新的“絕悟”版本建立了基於“觀察-行動-獎勵”的深度強化學習模型。\u003C\u002Fp\u003E\u003Cp\u003E這款模型無需人類數據,從白板學習(Tabula Rasa)開始,讓 AI 自己與自己對戰,\u003Cstrong\u003E一天的訓練強度高達人類 440 年。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EAI 完全從零開始摸索成功經驗,不僅學會了如何站位、打野、輔助保護和躲避傷害等遊戲常識,更驚喜的是,還探索出了不同於人類常規做法的全新策略。\u003C\u002Fp\u003E\u003Cp\u003E遊戲中測試的難點在於,AI 需在不完全信息、高度複雜度的情況作出複雜快速的決策。\u003C\u002Fp\u003E\u003Cp\u003E在龐大且信息不完備的地圖上,\u003Cstrong\u003E10 位參與者\u003C\u002Fstrong\u003E要在策略規劃、英雄選擇、技能應用、路徑探索及團隊協作上面臨大量、不間斷、即時的選擇。這帶來了極爲複雜的局面,\u003Cstrong\u003E預計有高達 10 的 20000 次方種操作可能性。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E要知道,\u003Cstrong\u003E整個宇宙原子總數也僅僅是10的80次方。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E團隊還創建 One Model 模型提升訓練效率,優化通信效率提升 AI 的團隊協作能力,使用零和獎懲機制讓 AI 能最大化團隊利益,使其打法果斷,有舍有得。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002Fcca306b7d2d44fa89a5e6f1f1c9c418e\" img_width=\"636\" img_height=\"168\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Ch1 class=\"ql-align-center\"\u003E\u003Cstrong\u003E拆解“絕悟”六大精彩時刻\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E下面,讓我們一起來複盤一下 AI 在打王者榮耀過程中的一些精彩時刻。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E1、探索全新策略\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E如圖,開局時,“絕悟”沒選擇傳統人類對線走位策略,而是由雙 C 位英雄虞姬和王昭君先一起清理中路第一波兵線,壓制敵方中輔。之後又轉上路壓制曹操血線。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002F7b26132994b34f5dae9f8f27663c5fbf\" img_width=\"300\" img_height=\"227\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E2、長線策略\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E在對線期,賽區聯隊三人壓迫下路,“絕悟”果斷選擇用三個 AI 反壓賽區聯隊的上路,最終雙方互換一塔,維持均勢。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002F9ba9cb1949ec4c79b420a294284e23f4\" img_width=\"402\" img_height=\"304\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E3、團隊協作\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E到比賽中期,“絕悟”四人追擊娜可露露,AI 達摩一腳將娜可露露反踢入 AI 羣中,再由四個 AI 完美配合拿下自己的首殺。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002F2777ecc35b424ea8bfc233ee83662d9a\" img_width=\"432\" img_height=\"326\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E4、即時策略\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E一對一時,賽區聯隊實力較強的曹操追擊“絕悟”虞姬,虞姬在殘血狀態退至高地。看到曹操抗塔血量大減後,把握機會絕地反殺。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002F4ccd2bbffbcd4835861bb6f9b3e5d972\" img_width=\"312\" img_height=\"236\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E5、即時策略+團隊協作\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E比賽後期在賽區聯隊的上路高地塔團戰,AI 王昭君先手被對方秒殺,“絕悟”果斷選擇反打,以漂亮的一波團戰全殲對手。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002F44af0c933dd244d0af4f56c710b99360\" img_width=\"324\" img_height=\"245\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002F6abb3d9e40764c018db532141452b3bb\" img_width=\"348\" img_height=\"263\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-justify\"\u003E\u003Cstrong\u003E6、即時策略+團隊協作\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E在賽區聯隊全隊覆滅後, “絕悟”的兵線尚未到達,下路高地塔還有過半血量,“絕悟”果斷選擇四人輪流抗塔,無兵線強拆塔。\u003C\u002Fp\u003E\u003Cp\u003E* 注:賽事尾聲,賽區聯隊團滅後,“絕悟”未直接推水晶,而是計算整體收益後,選擇先推最後一個高地塔,再推水晶直至勝利。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F3af55053dc1b44c39b2237443581a409\" img_width=\"390\" img_height=\"294\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002Fc9635966edc4439ea834b5199ef04a3a\" img_width=\"636\" img_height=\"168\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Ch1 class=\"ql-align-center\"\u003E\u003Cstrong\u003E起步三年,目標遠大\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E這已經不是騰訊 AI Lab第一次秀 AI 大戰遊戲玩家了。\u003C\u002Fp\u003E\u003Cp\u003E從 2016 年起,騰訊 AI Lab 就開始透露關於智能體研究的進程。他們研發的圍棋 AI “絕藝”(Fine Art),現擔任中國國家圍棋隊訓練專用 AI 。\u003C\u002Fp\u003E\u003Cp\u003E2017 年,“絕悟”研發啓動,到 2018 年時,“絕悟”已經達到業餘頂尖水平。\u003C\u002Fp\u003E\u003Cp\u003E去年5月,騰訊 AI Lab 匹茨堡大學的研究人員曾向 AI 頂會 ICML 2018 提交了一篇論文《Hierarchical Macro Strategy Model for MOBA Game AI》,嘗試了 AlphaGo Zero 中出現的蒙特卡洛樹搜索(MCTS)等技術,並取得了不錯的效果。\u003C\u002Fp\u003E\u003Cp\u003E那時,AI 還只能玩狄仁傑一個英雄。幾個月後,它們已經可以“五人”組隊,在王者段位和人類玩家打得有來有回了。\u003C\u002Fp\u003E\u003Cp\u003E在去年 12 月的 KPL 秋季決賽中,“絕悟”曾接受前職業 KPL 選手辰鬼、零度和職業解說白樂、九天和立人組成的人類戰隊的水平測試,這些人類戰隊的平均水平超過 99% 玩家。\u003C\u002Fp\u003E\u003Cp\u003E最終,AI 戰隊贏得比賽的勝利。\u003C\u002Fp\u003E\u003Cp\u003E騰訊還在射擊類頂級 AI 競賽 VizDoom 奪冠,並在《星際爭霸2》首先研發出擊敗內置 AI 的智能體。\u003C\u002Fp\u003E\u003Cp\u003E在今年 4 月的高通人工智能開放日上,高通宣佈將和騰訊 AI Lab 、王者榮耀、vivo四方共同打造一支王者榮耀 AI 電競戰隊“SUPEX”,希望能夠通過MOBA類遊戲場景的實驗環境來不斷提升和優化 AI 電競戰隊的實力,從而爲移動電競帶來更好的競技體驗。\u003C\u002Fp\u003E\u003Cp\u003E騰訊副總裁姚星介紹,\u003Cstrong\u003E“電子競技”將成爲策略協作型 AI “絕悟”未來短期內的主要應用場景。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E作爲數字時代最受年輕人歡迎的運動,電競已於 2018 年成爲亞運會表演項目,中國隊參賽獲兩金一銀的佳績。\u003C\u002Fp\u003E\u003Cp\u003E與傳統體育項目一樣,電競職業選手也需要手眼腦協調、策略和操作快速反應、團隊協作精神及大量刻苦訓練。\u003C\u002Fp\u003E\u003Cp\u003E藉助在算法和數據方面的優勢, AI 可爲職業選手提供數據、戰略與協作類實時分析與建議,及不同強度與級別的專業陪練。以前沿科技推動電競專業化發展,AI 將繼續推動中國電競在全球範圍內保持領先。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E此前,智東西曾對全球 AI 與人類對戰的相關戰事做系列報道。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E起底DeepMind:\u003C\u002Fp\u003E\u003Cp\u003E\u003Ca class=\"pgc-link\" data-content=\"mp\" href=\"https:\u002F\u002Fwww.toutiao.com\u002Fi6576999317683307015\u002F?group_id=6576999317683307015\" target=\"_blank\"\u003E起底讓人類汗顏的DeepMind:竟是個谷歌大包袱!\u003C\u002Fa\u003E\u003C\u002Fp\u003E\u003Cp\u003EOpenAI打Dota2:\u003C\u002Fp\u003E\u003Cp\u003E\u003Ca class=\"pgc-link\" data-content=\"mp\" href=\"https:\u002F\u002Fwww.toutiao.com\u002Fi6586797571178496520\u002F?group_id=6586797571178496520\" target=\"_blank\"\u003E人類一敗塗地!OpenAI戰勝Dota2半職業選手\u003C\u002Fa\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Ca class=\"pgc-link\" data-content=\"mp\" href=\"https:\u002F\u002Fwww.toutiao.com\u002Fi6679725399884169740\u002F?group_id=6679725399884169740\" target=\"_blank\"\u003EOpenAI封山戰人類Dota2冠軍!2:0完勝,苦練10月堪比人類4.5萬年\u003C\u002Fa\u003E\u003C\u002Fp\u003E\u003Cp\u003EFacebook:\u003C\u002Fp\u003E\u003Cp\u003E\u003Ca class=\"pgc-link\" data-content=\"mp\" href=\"https:\u002F\u002Fwww.toutiao.com\u002Fi6712653796662575627\u002F?group_id=6712653796662575627\" target=\"_blank\"\u003EAI對戰人類新里程碑!打6人德撲大勝世界冠軍,學習成本僅千元\u003C\u002Fa\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002Ff9842c612b1c4cce87f4617158aa3581\" img_width=\"636\" img_height=\"168\" alt=\"騰訊AI大戰王者榮耀!504場1v1僅輸1場,5v5達電競職業水平\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Ch1 class=\"ql-align-center\"\u003E\u003Cstrong\u003E結語:解決通用人工智能的關鍵一步\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E據騰訊介紹,從長期應用上,“絕悟”將是騰訊攻克 AI 終極研究難題——通用人工智能的關鍵一步。\u003C\u002Fp\u003E\u003Cp\u003EAGI 代表研發能在通用系統中執行多種複雜命令,達到或超越人類水平的 AI。\u003C\u002Fp\u003E\u003Cp\u003E從“絕藝”到“絕悟”,騰訊 AI Lab 不斷讓 AI 從 0 到 1 去學習進化,並發展出一套合理的行爲模式。\u003C\u002Fp\u003E\u003Cp\u003E這中間的研發經驗、方法與結論,長期來看,有望在大範圍內,如探索 AI 結合電競、醫療、製造、無人駕駛、農業到智慧城市管理等廣闊領域展現巨大潛力。\u003C\u002Fp\u003E\u003Cp\u003E而本次兩類技術水平測試結果,一定程度上反映出騰訊在深度強化學習、多智能體決策智能課題上的國際級 AI 研究水準,也標誌着騰訊在攻堅通用人工智能難題上更進一步。\u003C\u002Fp\u003E\u003Cp\u003E騰訊 AI Lab 將通過論文等形式進一步分享技術細節,通過開放研究,幫助和啓發更多研究者。\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E"'.slice(6, -6), groupId: '6720643924571980299
相關文章