2020年,對於一些歐洲運營商來說簡直是噩夢不斷。

斷網,斷網,大規模斷網頻發

2020年11月23日下午1點50分開始,Vodafone在德國的網絡發生大面積斷網,導致超過10萬用戶持續3個小時無法接入移動網絡。德國媒體報道,大量Vodafone用戶的手機顯示無法註冊網絡,只能用來拍照。

對於此次重大網絡事故,德國Vodafone給出的原因是:位於慕尼黑,法蘭克福和柏林的“中央控制單元發生故障”。看來是核心網故障導致。

2020年5月28日下午2點開始,捷克全國範圍內的幾乎所有Vodafone網絡服務都發生中斷,移動電話反覆顯示數據服務關閉,無法撥打電話,持續時間達4個小時,影響用戶規模達100萬人。

事故發生後,Vodafone捷克CEO公開向所有用戶道歉,官方公佈事故原因爲“核心網出現了一個意想不到的硬件錯誤,這導致網絡控制單元超載”

噩夢還在繼續。當地時間2020年8月28日上午9點20分開始,“由於核心網的某些設備故障”,英國Vodafone發生重大網絡故障,導致超過10萬用戶在3個小時內無法上網和通話。

此次故障投訴熱點分佈圖

2020年3月17日,正值疫情爆發,在“整個國家最需要連接的時候”,英國運營商又一次遭遇重大網絡事故,估計是因爲網絡擁塞原因,“不同運營商網絡之間的一些呼叫無法連接”,導致6000多萬移動用戶在超過12個小時內無法正常通信。

增強網絡可靠性迫在眉睫

記得早在2018年,英國運營商O2因“核心網網元SGSN–MME軟件問題”導致大規模斷網之後,有行業人士分析道,在5G正式商用之前把問題暴露出來未必是壞事,這樣才能及時糾正,總比以後5G時代出現問題再來補救好。然而,如今全球5G已經商用,重大網絡事故仍在接連不斷髮生。隨着5G腳步越來越快,這不禁讓人感到增強網絡可靠性的警鐘聲正敲得越來越響,越來越急促。

衆所周知,與過去任何一個G不同,過去的G主要負責連接人,而5G將走進工業、能源、金融、汽車、醫療等衆多涉及國計民生的領域,賦能千行百業數字化轉型,實現萬物智聯的世界。不難想象,進入5G時代,一旦網絡出現大規模斷網,輕則造成經濟損失,重則危及生命安全,甚至影響社會正常運轉。同時,隨着5G物聯規模不斷擴大,一旦出現網絡重大故障,影響範圍更大。

反觀以上頻頻發生的重大故障,故障原因幾乎都發生在網絡最關鍵的位置——核心網。作爲移動通信網絡的大腦,5G時代的核心網不僅承擔着調度和管理網絡全局資源的重任,更是行業數字化的使能平臺,如果類似事故發生在已實現大規模連接的5G網絡,後果簡直不敢想象。恐怕那個時候就不是公開道歉那麼簡單了,各行各業的經濟損失誰來賠償?

增強網絡可靠性已到了迫在眉睫的地步。那追根溯源,引發這些重大安全事故的根因是什麼?如何阻止事故頻發?而在如今地緣政治風暴愈演愈烈的背景下,少數政客們口中的所謂“網絡安全”以及鼓吹的“清潔網絡”又能阻止這些重大網絡事故頻頻發生嗎?

政治解決不了宕機問題

2020年7月,歐洲網絡與信息安全局(ENISA)發佈“2019年電信服務安全事故報告”(Telecom Services Security Incidents 2019 Annual Analysis)。

報告顯示,2014年到2019年期間,歐盟26個成員國報告的網絡事故數量穩定在每年150至170之間。其中,2019年度共發生153起網絡事故,損失的總用戶小時數(每起事故中的用戶數*小時數)約爲9.88億小時。相比2018年,損失的總用戶小時數有抬頭趨勢。

從事故根因分佈看,系統故障影響最大,約佔用戶總損失小時數的一半(4.79億個用戶小時);系統故障也是安全事故頻發的根因,佔事故總數的56%。其次是人員誤操作,自然災害和惡意攻擊行爲,分別佔據事故總數的27%,13%和5%。

報告進一步分析指出,導致系統故障的主要原因是硬件故障和軟件錯誤,約佔60%;其餘爲斷電、過載、線纜中斷等原因。同時,相比早些年固網影響而言,網絡故障對移動網絡的影響比重日益增大。

這份報告的分析結果與今年在歐洲頻發的重大網絡事故現象是一致的。2020年5月捷克Vodafone的“核心網硬件錯誤”屬於系統故障中的硬件故障;而德國Vodafone的“中央控制單元發生故障”,從用戶描述的“手機顯示無法註冊到網絡”現象來看,極有可能是HLR/HSS出現軟件或硬件故障而停止服務,不接受TAU/LAU和鑑權。

從這份報告可以明顯看出,由於電信行業的安全標準更高更完善,系統故障和人員誤操作纔是主要的安全風險,而惡意操作行爲佔比極低。

但不幸的是,少數政客卻本末倒置,誇大了“惡意操作行爲”,忽視了內部系統故障這個最大的安全隱患。

既然內部系統故障是網絡最大的安全隱患,那運營商該如何防範?

前幾天,看到一家歐洲研究公司列出了“5G時代運營商的夢想與現實”,其中第一條就指出,5G時代運營商的夢想是“有越來越多的供應商可供選擇”,但殘酷的現實卻是“僅有2-3家供應商可供選擇”。看到那張PPT,真是讓人笑中帶淚。

沒錯,運營商當然很清楚,堅持供應商多元化策略纔是提升網絡質量和穩定性的長久措施。這樣一來,不僅可以減少對單一供應商的過度依賴,避免把雞蛋都放進一個籃子裏,可分散風險,提高網絡的韌性,還能加大多供應商之間的競爭,促使供應商提升自己的產品能力和安全防護能力。

然而,在當前國際政治環境下,少數政客卻試圖簡單粗暴地用排除中國設備商的手段來獲得所謂的網絡安全,使得一些運營商可選擇的供應商太少,與網絡安全之路背道而馳。

簡而言之,通過採用供應商多元化策略,加大市場競爭,來不斷促使供應商提升硬件和軟件系統的可靠性和穩定性,乃至通過引入AI等新技術避免人工操作失誤,纔是保障未來網絡安全的陽光正道。政治手段不僅解決不了宕機問題,還給一些國家的運營商網絡的穩定性和可靠性蒙上了一層厚厚的陰影。

相關文章