網絡安全的未來是否掌握在 AI 手中（一）| 專欄

本系列文章最初發表在 TowardsDataScience 博客，經原作者 Ensar Seker 授權，InfoQ 中文站翻譯並分享。

從自主工具到虛擬助手，從聊天機器人到人臉 / 物體識別，近年來，機器學習已經取得了長足的進步。這是事實。那網絡安全呢？《網絡安全的未來是否掌握在人工智能手中？》系列文章將深入探討網絡安全與 AI 的關係，本文是系列專欄的第一篇。

在中國哲學中，陰陽代表着看似對立的兩極如何互補，達到和諧。

在網絡安全領域中，這一古老的哲學完美地代表了有監督學習和無監督學習之間的關係。例如，有監督的機器學習過程可以用於檢測；而無監督的機器學習使用聚類。在網絡安全和數據安全的研究和開發中，受監督的機器學習通常以機器學習算法的形式實現。

要描述人工智能並不容易，因爲它沒有明確的定義。現有的大多數定義，都是試圖將人工智能表述爲一種模仿人類智慧和行爲，並智能行動的計算機過程。但這樣的定義帶來了更多的疑問，比如，什麼是智慧？人類總是表現得聰明而合乎邏輯嗎？人工智能的理想目標是人類智能嗎？或者，計算機能做到比人類表現得更好嗎？將人工智能建立在理性行爲基礎上的方法的定義，指的是計算機做一些人類很難做到的事情。然而，在本文中，筆者採用了務實的方法來簡化這個問題，並將人工智能界定爲一個科學領域，負責針對人類難以找到解決方案的複雜問題，提出基於計算機的解決方案。

人工智能技術全景圖

AI 技術全景圖

人工智能在網絡安全方面的應用還相對較新。雖然一些網絡安全專家認爲，網絡安全的答案是使用機器學習來檢測複雜的漏洞，而且只有在基於人工智能的解決方案的幫助下確保 IT 環境的安全，網絡安全才會繼續取得成功。而其他人則認爲，雖然機器學習在尋找相似性方面非常出色，但在檢測異常情況方面還不夠好，因此並不適合網絡安全。

除了這些討論之外，從自主工具到虛擬助手，從聊天機器人到人臉 / 物體識別，近年來，機器學習已經取得了長足的進步。這是一個事實。隨着我們邁向網絡安全更多地融入人們日常生活的未來，重要的是要意識到基於機器和深度學習的不同方法，以便更好地保護網絡和數據安全，抵禦日益複雜和先進的攻擊。

你可能已經知道，訓練機器神經網絡的機器算法有四種：有監督學習、無監督學習、半監督學習（也稱爲主動學習）、強化學習。有監督學習是指從訓練數據集中學習；無監督式機器是從數據本身學習，而數據本身檢測威脅的能力有限，因爲它只尋找以前看到和標記的細節；而無監督學習不斷掃描網絡並發現異常。然而，無監督學習無需標記的訓練數據，因此更適合檢測可疑活動，包括檢測以前從未觀察到的攻擊行爲。

機器學習算法

作爲網絡安全系統的一部分，機器學習已被用來減少攻擊檢測和防禦工具可以處理的負載。人工智能算法類似於真實的人類決策機制，試圖對決策機器進行建模。

人們已經進行了許多嘗試，試圖替代無人值守的機器學習安全解決方案，帶來了針對各種安全問題的解決方案，但這些解決方案未經測試。許多早期的嘗試都難以生成足夠的數據，並不能有效地發現複雜的漏洞，如身份欺詐或先進的網絡攻擊。

相比之下，無監督學習是指發現和描述數據中隱藏的結構。這個問題與定義距離函數的問題有關，因爲大多數（如果不是全部的話）聚類算法都是基於數值和非分類數據的，因此，我們對聚類算法的瞭解和對分類的瞭解一樣多。

在網絡安全的背景下，人工智能試圖通過權衡表明系統受到威脅的行爲模式來保護系統。從這個角度來看，機器學習就是導致惡意行爲的學習模式的過程。

在信息安全領域，人工智能解決方案一般以分析師爲導向，以無監督機器學習爲重點。使用無監督式的機器學習來檢測罕見或異常的模式，可以增加對新攻擊的檢測。然而，它也可能會引發更多的誤報和警告。這需要大量的分析工作來調查這些誤報的準確性。這種誤報會造成警報疲勞和不安全感，而且隨着時間的推移，還會導致其重新採用以分析爲中心的解決方案，從而由此產生缺陷。信息安全行業面臨的三大挑戰，每一個挑戰都可以通過機器學習解決方案來解決，這些已確定的挑戰具體如下：

標記數據的缺失：許多組織缺乏使用以前攻擊的標記示例和有監督學習模型的能力。
不斷演變的攻擊：即使可以控制學習模型，攻擊者也可以改變他們的行爲並“覆蓋”它們。
研究或調查的時間和預算有限：申請分析師調查攻擊既昂貴又耗時。

由於業界仍在嘗試將該技術作爲概念驗證，然而，在安全解決方案是機器學習的情況下，信任的想法是理想的。它可以幫助提高打擊網絡犯罪的力度，而人工智能可以通過自動化模式識別過程來促進人類的努力。機器學習系統根據類別報告有用的數據，而分析師則公開談論機器學習如何成爲安全的黑匣子解決方案，而首席信息安全觀們並不十分清楚幕後是怎麼回事。

今天，人工智能還沒有準備好替代人類，但通過自動化模式識別過程，它可以增強人類的努力。這裏有一個不可否認的事實，因爲機器學習在網絡防禦中有着非常不同的用途。

考慮到所有的使用領域，可以將人工智能在網絡空間的分爲兩類：一類是利用人工智能進行網絡防禦，另一類是利用人工智能進行網絡進攻。

在第二篇文章中中，我們將討論人工智能在網絡防禦中的應用。

參考文章：

[1] 《人工智能基礎》（Fundamentals of Artificial Intelligence），K.R. Chowdhary，Springer India，2020 年。

[2] 《AI2：訓練大數據機器防禦》（AI2: Training a Big Data Machine to Defend），K. Veeramachaneni、I. Arnaldo、A. Cuesta-Infante、V. Korrapati、C. Bassias、K. Li，IEEE 大數據國際安全會議，紐約，2016 年。