本系列文章最初發表在 TowardsDataScience 博客,經原作者 Ensar Seker 授權,InfoQ 中文站翻譯並分享。

從自主工具到虛擬助手,從聊天機器人到人臉 / 物體識別,近年來,機器學習已經取得了長足的進步。這是事實。那網絡安全呢?《網絡安全的未來是否掌握在人工智能手中?》系列文章將深入探討網絡安全與 AI 的關係,本文是系列專欄的第一篇。

在中國哲學中,陰陽代表着看似對立的兩極如何互補,達到和諧。

在網絡安全領域中,這一古老的哲學完美地代表了有監督學習和無監督學習之間的關係。例如,有監督的機器學習過程可以用於檢測;而無監督的機器學習使用聚類。在網絡安全和數據安全的研究和開發中,受監督的機器學習通常以機器學習算法的形式實現。

要描述人工智能並不容易,因爲它沒有明確的定義。現有的大多數定義,都是試圖將人工智能表述爲一種模仿人類智慧和行爲,並智能行動的計算機過程。但這樣的定義帶來了更多的疑問,比如,什麼是智慧?人類總是表現得聰明而合乎邏輯嗎?人工智能的理想目標是人類智能嗎?或者,計算機能做到比人類表現得更好嗎?將人工智能建立在理性行爲基礎上的方法的定義,指的是計算機做一些人類很難做到的事情。然而,在本文中,筆者採用了務實的方法來簡化這個問題,並將人工智能界定爲一個科學領域,負責針對人類難以找到解決方案的複雜問題,提出基於計算機的解決方案。

人工智能技術全景圖

AI 技術全景圖

人工智能在網絡安全方面的應用還相對較新。雖然一些網絡安全專家認爲,網絡安全的答案是使用機器學習來檢測複雜的漏洞,而且只有在基於人工智能的解決方案的幫助下確保 IT 環境的安全,網絡安全才會繼續取得成功。而其他人則認爲,雖然機器學習在尋找相似性方面非常出色,但在檢測異常情況方面還不夠好,因此並不適合網絡安全。

除了這些討論之外,從自主工具到虛擬助手,從聊天機器人到人臉 / 物體識別,近年來,機器學習已經取得了長足的進步。這是一個事實。隨着我們邁向網絡安全更多地融入人們日常生活的未來,重要的是要意識到基於機器和深度學習的不同方法,以便更好地保護網絡和數據安全,抵禦日益複雜和先進的攻擊。

你可能已經知道,訓練機器神經網絡的機器算法有四種:有監督學習、無監督學習、半監督學習(也稱爲主動學習)、強化學習。有監督學習是指從訓練數據集中學習;無監督式機器是從數據本身學習,而數據本身檢測威脅的能力有限,因爲它只尋找以前看到和標記的細節;而無監督學習不斷掃描網絡並發現異常。然而,無監督學習無需標記的訓練數據,因此更適合檢測可疑活動,包括檢測以前從未觀察到的攻擊行爲。

機器學習算法

作爲網絡安全系統的一部分,機器學習已被用來減少攻擊檢測和防禦工具可以處理的負載。人工智能算法類似於真實的人類決策機制,試圖對決策機器進行建模。

人們已經進行了許多嘗試,試圖替代無人值守的機器學習安全解決方案,帶來了針對各種安全問題的解決方案,但這些解決方案未經測試。許多早期的嘗試都難以生成足夠的數據,並不能有效地發現複雜的漏洞,如身份欺詐或先進的網絡攻擊。

相比之下,無監督學習是指發現和描述數據中隱藏的結構。這個問題與定義距離函數的問題有關,因爲大多數(如果不是全部的話)聚類算法都是基於數值和非分類數據的,因此,我們對聚類算法的瞭解和對分類的瞭解一樣多。

在網絡安全的背景下,人工智能試圖通過權衡表明系統受到威脅的行爲模式來保護系統。從這個角度來看,機器學習就是導致惡意行爲的學習模式的過程。

在信息安全領域,人工智能解決方案一般以分析師爲導向,以無監督機器學習爲重點。使用無監督式的機器學習來檢測罕見或異常的模式,可以增加對新攻擊的檢測。然而,它也可能會引發更多的誤報和警告。這需要大量的分析工作來調查這些誤報的準確性。這種誤報會造成警報疲勞和不安全感,而且隨着時間的推移,還會導致其重新採用以分析爲中心的解決方案,從而由此產生缺陷。信息安全行業面臨的三大挑戰,每一個挑戰都可以通過機器學習解決方案來解決,這些已確定的挑戰具體如下:

  • 標記數據的缺失:許多組織缺乏使用以前攻擊的標記示例和有監督學習模型的能力。
  • 不斷演變的攻擊:即使可以控制學習模型,攻擊者也可以改變他們的行爲並“覆蓋”它們。
  • 研究或調查的時間和預算有限:申請分析師調查攻擊既昂貴又耗時。

由於業界仍在嘗試將該技術作爲概念驗證,然而,在安全解決方案是機器學習的情況下,信任的想法是理想的。它可以幫助提高打擊網絡犯罪的力度,而人工智能可以通過自動化模式識別過程來促進人類的努力。機器學習系統根據類別報告有用的數據,而分析師則公開談論機器學習如何成爲安全的黑匣子解決方案,而首席信息安全觀們並不十分清楚幕後是怎麼回事。

今天,人工智能還沒有準備好替代人類,但通過自動化模式識別過程,它可以增強人類的努力。這裏有一個不可否認的事實,因爲機器學習在網絡防禦中有着非常不同的用途。

考慮到所有的使用領域,可以將人工智能在網絡空間的分爲兩類:一類是利用人工智能進行網絡防禦,另一類是利用人工智能進行網絡進攻。

在第二篇文章中中,我們將討論人工智能在網絡防禦中的應用。

參考文章:

[1] 《人工智能基礎》(Fundamentals of Artificial Intelligence),K.R. Chowdhary,Springer India,2020 年。

[2] 《AI2:訓練大數據機器防禦》(AI2: Training a Big Data Machine to Defend),K. Veeramachaneni、I. Arnaldo、A. Cuesta-Infante、V. Korrapati、C. Bassias、K. Li,IEEE 大數據國際安全會議,紐約,2016 年。

作者介紹:

Ensar Seker,安全研究員。

原文鏈接:

https://towardsdatascience.com/is-the-future-of-cyber-security-in-the-hands-of-artificial-intelligence-ai-1-2b4bd8384329

source/image/1c/1d/1ce05dde72000a86cfa79d95939b691d.gif)

相關文章