6月30日,阿里巴巴安全部資深總監路全在2018 全球人工智能與機器人峯會(CCF-GAIR)上指出, 阿里已建成流量清洗智能防禦系統治理“污染數據”問題。

圖說:6月30日,阿里巴巴安全部資深總監路全在2018 全球人工智能與機器人峯會(CCF-GAIR)上指出, 阿里已建成流量清洗智能防禦系統治理“污染數據”問題。

大數據、計算和算法是人工智能的三大要素,如何保障數據安全和數據的清潔度,是提升智能產品安全性的關鍵因素。近日,BAT等互聯網企業齊聚深圳,在2018 全球人工智能與機器人峯會(CCF-GAIR)上圍繞智能安全進行深入探討。

作爲受邀嘉賓,阿里巴巴安全部算法資深總監路全指出,人工智能帶來更多可能的同時,也帶來了諸多安全風險,尤其黑灰產正在使用“數據污染”、“數據中毒”等新型複雜化手段,與人工智能行業的正向發展進行激烈對抗。

他以人工智能汽車的安全問題舉例稱,除了“利用智能算法本身缺陷改變交通標誌”或以“傳統的黑客入侵滲透控制其他平民汽車”等方式,可以控制攻擊智能汽車外,通過向智能設備雲端或系統輸入污染、“中毒”數據,同樣可以用來攻擊人工智能系統及設備。

其攻擊原理是,人工智能都基於大數據算法來實現精準運算,最終產生實際行爲,正是利用這一特性,對抗方可以輸入一些受污染的數據“餵養”、“訓練”人工智能系統,使其偏離正常的運算目標,最終產生失焦的運算行爲,從而引發一系列安全風險。

“黑灰產對抗方會用大量低級爬蟲或低級流量,來試圖爬取互聯網公司的數據信息,他們明知低級爬蟲很容易被殺掉,但仍會不惜成本投入。”路全解釋稱,這些低級爬蟲樣本產生的“污染數據”會影響和扭曲算法模型,最終他們還會利用少量摻雜其中的高級爬蟲進行攻擊。

“數據中毒的目的就是讓機器學習模型不能覆蓋正確的目標,從而使其防護失效。”路全表示,阿里安全已經建立起了雙層防護機制,專門防護系統安全和防護數據污染。

“所有互聯網公司必須警惕‘數據污染’這種攻擊手段,因爲由黑灰產發起的機器流量是數據污染的源頭,爲此阿里巴巴除了在傳統網絡安全上建立安全防禦體系防禦黑客入侵和滲透外,還建立了全新的流量清洗智能防禦系統。”路全介紹,阿里巴巴建立的機器流量防控體系主要由三部分組成,其中包括相當於“眼睛”的檢測模塊;以及等同“大腦”的分類模型,還有輔助系統。

基於阿里巴巴擁有的豐富業態,阿里安全實驗室在機器算法方面已有深入研究,由達摩院領銜的各大實驗室也已研發出各種優秀算法,並應用於阿里生態的搜索、廣告、IoT、客服等多個業務線。

“如果把AI視作一個正在茁壯成長的小孩,那麼髒數據或數據污染就是病毒有害物,AI算法和機器學習是根據大量數據來進行的,如果數據被污染,就像小孩喫了不健康的東西。”路全形象地比喻說,“要像呵護孩子一樣,去呵護我們的AI系統。”

相關文章