7月29日,2020全球閃存峯會晚20:00,《百易堂▪閃存時刻》準時開播。百易數智研究院負責人宋家雨繼續擔任節目主持人,浪潮存儲產品線資深架構師葉毓睿應邀做客。

沒有更多寒暄,節目直接進入刀光劍影般的主題:

劍指性能/容量兼顧,葉大師見招拆招

針對智算中心新存儲設計,浪潮提出從七個方面進行極致設計,分別是極簡架構、極致安全、極致穩定、極致容量、極致性能、極致雲化和極易管理,通過一套軟件棧,實現一個存儲平臺支持一個數據中心。話題由此展開。

宋家雨:七個極致中設計比較難的性能、容量同時兼顧,魚和熊掌兼得,如何才能夠做到?

葉毓睿:極致性能、極致容量是存儲系統設計的兩大塊,能不能很好的統一起來,我相信這是未來一個長期的發展目標,背後原因也很簡單,一是在於數據迅猛增長,同時面臨各種各樣的應用,如多雲、多元的數據的形態,由此帶來運維、管理的巨大挑戰。

站在用戶的角度,即便今天可能沒有意識到,但是 到未來的某個時刻,管理工作量、管理複雜度,會呈現10倍速增長,屆時就會意識到簡單、易用、靈活、擴展的重要性。在這個過程中,特定業務場景還需要保持高性能,同時又要滿足海量數據存放的需要,我相信這樣的設計會提上日程。

從當下來看,浪潮存儲主要還是分成兩大塊。就是我們說的一個數據中心,有兩套存儲平臺,用集中式存儲去響應用戶在性能上的挑戰。比如說更高的IOPS、更低的延時。這部分也體現在最近這幾個月的SPC-1測試成績,浪潮破了世界記錄,比如說包含在16個控制器裏面,我們做到全球第一,能夠做到752萬IOPS,而且時延小於0.5毫秒。在8控制器的存儲,浪潮做到了300多萬IOPS,延時也非常低。

所以我們用集中式存儲去響應到對極致性能的需求。

針對極致容量,也就是海量非結構化數據,浪潮使用分佈式存儲AS13000系列,能夠提供幾十PB,甚至上千PB的容量支撐,完成用戶對存儲容量的需求。

宋家雨:SPC-1測試,有沒有一些故事能分享一下?此次測試,有沒有用到NVMe SSD這樣的技術?有沒有采用SCM,如Optane速技術?

葉毓睿:SPC-1我也簡單介紹一下,它是以IOPS作爲標測值的一個權威評測。老實說,在我沒有深入瞭解SPC-1的時候,我也以爲可能就是70%/30%讀寫,4K/8K數據小IO的測試。但是經過深入分析以後,我發現並不是。

SPC-1測試實際上是一個科學的,而且又很複雜IO模型負載組合, 實際可以分成幾種不同負載,如ASU1、ASU2、ASU3,分別對應不同的應用場景,可以是數據庫業務類型,也可以是高帶寬持續寫入,把這些場景綜合加以考量,這對存儲是一個很大挑戰。

性能之外,對可靠性、持久性等也會有嚴格限定。比如在測SPC-1時候,我們採用全閃存陣列,會由內存來作爲控制器緩存,如果沒有一個科學測試的方法,訪問壓力實際在控制器的緩存上,如此會造成IOPS的虛高。另外還有一種考量,就是在全閃存SSD的介質上,有一個反覆擦寫的過程,如此測出來的IOPS,才能更接近於實際應用,也是用戶希望看到的測試結果。

在SPC-1中,根據存儲系統的配置,如16控制器的產品, 需要長達8個小時不停的壓測,而這樣的一個壓測的數據的寫入,會使得全閃存陣列SSD介質至少完完全全寫入兩遍以上,這樣就可以排除結果虛高的問題。

我認爲SPC-1所測出來的性能,能夠貼近於用戶的真實場景。

我們此次參測的產品是集中式存儲AS5600、AS5500,目前還沒有用到最新的SCM存儲介質,如Optane Memory,也就是AEP。如果能夠把這樣的一些新介質使用進去的話,有可能我們還能再破世界記錄,同樣的也沒有使用NVMe SSD這樣的技術。

分佈式存儲、軟件定義存儲不能劃等號,葉大師娓娓道來

在很多人的認知中,軟件定義存儲、分佈式存儲和雲存儲幾乎是可以劃等號的,與集中式存儲之爭,也是用戶關注的話題。

宋家雨:SDS(軟件定義存儲)和分佈式存儲的關係是什麼?未來的發展如何?

葉毓睿:軟件定義存儲脫胎於SDN,也就是軟件定義網絡;以及SDDC,也就是軟件定義數據中心,很重要的內容,是強調數據平面和控制平面分離。爲什麼要做分離,實際上就是要實現我們所說的這個軟件定義。

軟件定義用一個更通俗話說,就是來實現存儲即服務這樣一個理想目標。爲此,需要在數據平面層去逐漸剝離可操控的成分,將其上升到控制平面層,實現數據調度、流向、指揮;在數據控制平面,通過雲管理軟件,如開源OpenStack、Cinder、Manila、(Swift),以及像商業平臺VMware的Storage Police BasedManagement(SPBM)等,自由調用存儲,以及邏輯卷,讓控制平面通過API可以快速創建。

在創建存儲卷的過程中,可以事先通過策略方式事先定義好,包括自動分級、精簡配置、去重、壓縮,快照、容災等。這樣就能滿足存儲即服務的目標,實際上,這就是一個軟件定義的存儲。

在軟件定義存儲的範疇裏面,包含了集中式存儲,也包含了分佈式存儲。但是在市場主流聲音當中,分佈式的存儲是更多呈現的方式,這是最近幾年分佈式存儲迅猛增長所致。如今數字宇宙其實比摩爾定律發展還要快,基本上是每18個月新增數據是過去所有數據的總和。而在這樣一個數據宇宙新增長的數據當中,根據IDC的報告,實際上有超過80%以上的都是非結構化數據,而非結構化數據比較好的一個承載體就是用分佈式存儲。

談到未來的市場演進,我覺得在一個比較長的時間內,集中式存儲和分佈式存儲會長期並存。因爲非結構化數據增長幅度要遠比結構化數據增加的快得多,所以從市場的情況來看,集中式的存儲基本上沒有什麼增長,甚至是負增長。但是分佈式存儲它的份額在不斷的增加。

在我的印象當中, 2016年前後談論最多的概念是SeverSAN,它簡單看成爲一個分佈式的存儲,也包含超融合。那麼這樣的一個架構,在外部存儲市場份額當中不超過10%。但是現在看,從2019年的數據,佔比已經超過了40%,而2018年只有30%+。由此可以看到其發展非常迅猛。

但我相信在較長的一段時間,這兩個形態存儲會同時存在。 軟件定義存儲有一個前提,就是硬件發展非常迅猛,然後纔有軟件騰挪空間。我們設想一下,如果不是有那麼多富餘的處理器CPU,怎麼可能會有軟件定義計算,也就是虛擬化;如果沒有性能強勁的SSD,以及低延時網絡、RDMA技術,那麼也不會出現軟件定義存儲。如果硬件能夠繼續迅猛發展兩種存儲形態合二而一也不是沒有可能。

除了硬件迅猛發展, AI技術在存儲、管理的一個深度的應用,如浪潮存儲InView,針對磁盤故障預測,能夠根據過去歷史的容量以及歷史性能數據,預測未來達到某個時間點的時候,容量使用可能達到一個什麼樣的百分比,存儲性能可能會達到一個什麼樣的閾值狀態。通過這樣一個方式去預警,決定是不是擴容。再往後發展的話,是不是可能能夠根據歷史分析業務應用的場景,如果能夠把這樣的一些算法寫到存儲智能管理當中,未來存儲就會變得更加聰明,更加智能。

雲化世界,切忌雲山霧罩,聽葉大師指點迷津

未來的世界是雲的世界,從私有云、混合雲到容器化、DevOps的變化,數據存儲如何與之匹配和適應。

宋家雨:雲計算是毫無爭議發發展方向,雲環境以分佈式存儲爲主,全閃存陣列在雲環境裏,還有戲分嗎?

葉毓睿:相信也會增加,雲化是未來發展趨勢,應用初期,用戶在選擇場景應用的時候可能會更多選擇一些邊緣、非生產系統。但是使用習慣逐步深入,漸漸也會考慮跟交易相關的、一些生產系統也會轉移到雲化環境中,對性能、低延時也會提出相應的挑戰和要求。所以,我相信無論混閃、全閃也會在雲化環境中逐步提高。可以看到,國內一些公有云目前在提供高性能存儲空間。

談到雲化,有兩個大IT趨勢,一個是混合雲,還有就是容器化。在混合雲部分,私有云還是佔更大比例,爲什麼會有大量數據存放在私有云呢?我覺得其實有很多的因素,如說隱私數據保護、數據響應、數據合規性,還有很重要一點是用戶使用習慣,譬如原有業務是在大機、後面在小機,再到x86,使用Web+中間件+數據庫的三層的結構,用戶要從這樣的形態遷移雲原生應用,要投入的時間和精力,涉及使用習慣的改變,這會是非常大的阻礙。

浪潮存儲做出了很好嘗試,比方集中式存儲以及雲網關,相當於雲分層,或者叫雲歸檔。什麼意思呢?如果需要頻繁訪問,從本地集中式存儲提供。可以把那些長期不怎麼使用的數據,可以歸檔到公有云,如果數據又需要讀取,爲了避免讀取速度緩慢,就會從公有云再把數據拉回本地集中式存儲。

在私有云創建過程中,對存儲提出了一個挑戰,要求存儲應該是軟件定義的存儲,現在有兩大平臺選擇,一個是開源平臺,一個是商業的平臺。在開的平臺裏,像OpenStack這樣的雲管理軟件,Cinder是塊接口,Manila是文件接口,Swift就是對象接口。需要有相關API去支撐,符合這種標準和規範。

商業平臺以VMware爲代表,需要支撐VAAI以及NAS接口。

浪潮存儲能夠較好應對以上的挑戰,如浪潮AS13000,能夠同時支持文件、塊和對象。有些其實是兩套不同存儲,只是通過圖形管理界面管理起來。浪潮是在分佈式最小三個集羣節點數去構建不同數據池,就可以實現對私有云,對軟件定義存儲的支持。

針對容器化。像金融行業、電信行業、互聯網行業,還有像汽車自動駕駛,以及物流行業等很多行業,已經開始部署容器化,使得他們能夠去實現DevOps,能夠敏捷應對前端瞬息萬變的業務對IT資源的需求。與容器化關聯,就是存儲怎麼樣能夠支持到容器編排調度工具,去分配相應持久化存儲空間,對邏輯卷的需求達到數千個,數萬個。

對此,不可能按照原始方式,每個都進駐到圖形管理界面,或者是一個命令行去把這些容器的持久化卷創建出來。這時候需要讓前端容器編排調度工具去驅動,去創建。目前,浪潮不管是集中式的存儲,還是分佈式存儲,都能夠支撐CSI(Container Storage Interface)。

相關文章