微軟亞洲研究院(MSR Asia)開發出麻將人工智能系統——超級鳳凰(Suphx)。研發者們相信,它不僅掌握了麻將對弈,還能贏得99%的對局,做好了解決實際任務的準備。俄羅斯衛星通訊社採訪了機器學習領域的專家,試圖弄清楚這種系統在實踐中可能有何益處。

長久以來人們認爲,不可能製造出能與人類選手平等進行麻將對弈的人工智能。微軟亞洲研究院專家開發的超級鳳凰人工智能系統勝任了這項任務。2019年8月,超級鳳凰人工智能系統首次得到展示,當時這款軟件就榮升十段水平(總共十一段)。超級鳳凰在全球最高水平的立直麻將平臺天鳳(tenhou.net)上的穩定排名爲8.7左右,高於最佳選手的平均值——7.4。

微軟亞洲研究院集團副總裁表示,未來計劃採用這些算法解決由未知因素和偶然事件引起的現實世界的複雜問題,如:爲了建立更準確的無人駕駛汽車算法,分析和計劃經濟活動風險、優化生產效率、降低物流費用等。

創視睿公司總經理張慶認爲,選擇讓人工智能學習麻將是微軟亞洲研究院的極佳決定。

他說:“麻將變量太多,計算機和AI是不可能打敗人類的。他們應用的應該是類腦計算,模擬人的邏輯思維,但是它的運算速度又比人腦要快。其實他們是在訓練一種基礎的邏輯思維能力,比‘阿爾法狗’更高級,相比於人的邏輯思維能力來說更初級。但是如果這種初級的邏輯思維能力訓練得比較好,它可以預測人類的行爲。也就是說,如果這項能力訓練得比較好,在掌握了人類的行爲規律之後,它可以判斷人類下一步要幹什麼”。

超級鳳凰所採用的算法更優越,與學習圍棋和棋盤上所有信息對選手開放的其它遊戲相比。在打麻將時,僅僅很好理解遊戲是不夠的,還要擁有“直覺”。但如何能把直覺這種人類的概念教給人工智能呢?

張慶說:“所謂人的直覺是指一個人通過自己的人生閱歷和人生經歷,並通過人自有的邏輯,進行一個判斷,進而得出的結果。而人工智能的‘直覺’就是可行性的最高值,通過邏輯推理判斷出哪一種可能的方案最能夠被實現,就能預測出下一步會做什麼事情”。

人工智能的學習過程歸結爲與國外數據無限比較。超級鳳凰人工智能已經學會了如何從已知信息中得出結論以解決突然出現的任務,試圖以這種方式理解人類的心理。

張慶舉例說,譬如書裏寫了1+1=2,2+2=4,但書上沒有寫1+3等於幾,這個時候技術可以通過邏輯推理得出正確結果。但是這種邏輯推理是偏向於二維的,而麻將的推理是多維的。多維的意思是它的變量很多,所以難度就很大。因此在日常生活中,如果掌握了這個人的消費心理,通過這種邏輯推理就可以判斷出這個人下一步的消費行爲是什麼。像麻將和圍棋都是(涉及人的)邏輯遊戲,將遊戲應用於AI訓練的核心目的是訓練人的邏輯,但如果用遊戲去模擬的話就可以屏蔽行業屬性,規避倫理問題。

麻將是比其它桌上游戲更復雜的對弈,因此對弈過程既是藝術又是科學。麻將選手在對弈過程中巧妙利用觀察力、直覺、戰略、計算、運氣的複雜套路,對人工智能系統來說是一個獨特的任務。

相關文章