7月29日,2020全球闪存峰会晚20:00,《百易堂▪闪存时刻》准时开播。百易数智研究院负责人宋家雨继续担任节目主持人,浪潮存储产品线资深架构师叶毓睿应邀做客。

没有更多寒暄,节目直接进入刀光剑影般的主题:

剑指性能/容量兼顾,叶大师见招拆招

针对智算中心新存储设计,浪潮提出从七个方面进行极致设计,分别是极简架构、极致安全、极致稳定、极致容量、极致性能、极致云化和极易管理,通过一套软件栈,实现一个存储平台支持一个数据中心。话题由此展开。

宋家雨:七个极致中设计比较难的性能、容量同时兼顾,鱼和熊掌兼得,如何才能够做到?

叶毓睿:极致性能、极致容量是存储系统设计的两大块,能不能很好的统一起来,我相信这是未来一个长期的发展目标,背后原因也很简单,一是在于数据迅猛增长,同时面临各种各样的应用,如多云、多元的数据的形态,由此带来运维、管理的巨大挑战。

站在用户的角度,即便今天可能没有意识到,但是 到未来的某个时刻,管理工作量、管理复杂度,会呈现10倍速增长,届时就会意识到简单、易用、灵活、扩展的重要性。在这个过程中,特定业务场景还需要保持高性能,同时又要满足海量数据存放的需要,我相信这样的设计会提上日程。

从当下来看,浪潮存储主要还是分成两大块。就是我们说的一个数据中心,有两套存储平台,用集中式存储去响应用户在性能上的挑战。比如说更高的IOPS、更低的延时。这部分也体现在最近这几个月的SPC-1测试成绩,浪潮破了世界记录,比如说包含在16个控制器里面,我们做到全球第一,能够做到752万IOPS,而且时延小于0.5毫秒。在8控制器的存储,浪潮做到了300多万IOPS,延时也非常低。

所以我们用集中式存储去响应到对极致性能的需求。

针对极致容量,也就是海量非结构化数据,浪潮使用分布式存储AS13000系列,能够提供几十PB,甚至上千PB的容量支撑,完成用户对存储容量的需求。

宋家雨:SPC-1测试,有没有一些故事能分享一下?此次测试,有没有用到NVMe SSD这样的技术?有没有采用SCM,如Optane速技术?

叶毓睿:SPC-1我也简单介绍一下,它是以IOPS作为标测值的一个权威评测。老实说,在我没有深入了解SPC-1的时候,我也以为可能就是70%/30%读写,4K/8K数据小IO的测试。但是经过深入分析以后,我发现并不是。

SPC-1测试实际上是一个科学的,而且又很复杂IO模型负载组合, 实际可以分成几种不同负载,如ASU1、ASU2、ASU3,分别对应不同的应用场景,可以是数据库业务类型,也可以是高带宽持续写入,把这些场景综合加以考量,这对存储是一个很大挑战。

性能之外,对可靠性、持久性等也会有严格限定。比如在测SPC-1时候,我们采用全闪存阵列,会由内存来作为控制器缓存,如果没有一个科学测试的方法,访问压力实际在控制器的缓存上,如此会造成IOPS的虚高。另外还有一种考量,就是在全闪存SSD的介质上,有一个反复擦写的过程,如此测出来的IOPS,才能更接近于实际应用,也是用户希望看到的测试结果。

在SPC-1中,根据存储系统的配置,如16控制器的产品, 需要长达8个小时不停的压测,而这样的一个压测的数据的写入,会使得全闪存阵列SSD介质至少完完全全写入两遍以上,这样就可以排除结果虚高的问题。

我认为SPC-1所测出来的性能,能够贴近于用户的真实场景。

我们此次参测的产品是集中式存储AS5600、AS5500,目前还没有用到最新的SCM存储介质,如Optane Memory,也就是AEP。如果能够把这样的一些新介质使用进去的话,有可能我们还能再破世界记录,同样的也没有使用NVMe SSD这样的技术。

分布式存储、软件定义存储不能划等号,叶大师娓娓道来

在很多人的认知中,软件定义存储、分布式存储和云存储几乎是可以划等号的,与集中式存储之争,也是用户关注的话题。

宋家雨:SDS(软件定义存储)和分布式存储的关系是什么?未来的发展如何?

叶毓睿:软件定义存储脱胎于SDN,也就是软件定义网络;以及SDDC,也就是软件定义数据中心,很重要的内容,是强调数据平面和控制平面分离。为什么要做分离,实际上就是要实现我们所说的这个软件定义。

软件定义用一个更通俗话说,就是来实现存储即服务这样一个理想目标。为此,需要在数据平面层去逐渐剥离可操控的成分,将其上升到控制平面层,实现数据调度、流向、指挥;在数据控制平面,通过云管理软件,如开源OpenStack、Cinder、Manila、(Swift),以及像商业平台VMware的Storage Police BasedManagement(SPBM)等,自由调用存储,以及逻辑卷,让控制平面通过API可以快速创建。

在创建存储卷的过程中,可以事先通过策略方式事先定义好,包括自动分级、精简配置、去重、压缩,快照、容灾等。这样就能满足存储即服务的目标,实际上,这就是一个软件定义的存储。

在软件定义存储的范畴里面,包含了集中式存储,也包含了分布式存储。但是在市场主流声音当中,分布式的存储是更多呈现的方式,这是最近几年分布式存储迅猛增长所致。如今数字宇宙其实比摩尔定律发展还要快,基本上是每18个月新增数据是过去所有数据的总和。而在这样一个数据宇宙新增长的数据当中,根据IDC的报告,实际上有超过80%以上的都是非结构化数据,而非结构化数据比较好的一个承载体就是用分布式存储。

谈到未来的市场演进,我觉得在一个比较长的时间内,集中式存储和分布式存储会长期并存。因为非结构化数据增长幅度要远比结构化数据增加的快得多,所以从市场的情况来看,集中式的存储基本上没有什么增长,甚至是负增长。但是分布式存储它的份额在不断的增加。

在我的印象当中, 2016年前后谈论最多的概念是SeverSAN,它简单看成为一个分布式的存储,也包含超融合。那么这样的一个架构,在外部存储市场份额当中不超过10%。但是现在看,从2019年的数据,占比已经超过了40%,而2018年只有30%+。由此可以看到其发展非常迅猛。

但我相信在较长的一段时间,这两个形态存储会同时存在。 软件定义存储有一个前提,就是硬件发展非常迅猛,然后才有软件腾挪空间。我们设想一下,如果不是有那么多富余的处理器CPU,怎么可能会有软件定义计算,也就是虚拟化;如果没有性能强劲的SSD,以及低延时网络、RDMA技术,那么也不会出现软件定义存储。如果硬件能够继续迅猛发展两种存储形态合二而一也不是没有可能。

除了硬件迅猛发展, AI技术在存储、管理的一个深度的应用,如浪潮存储InView,针对磁盘故障预测,能够根据过去历史的容量以及历史性能数据,预测未来达到某个时间点的时候,容量使用可能达到一个什么样的百分比,存储性能可能会达到一个什么样的阈值状态。通过这样一个方式去预警,决定是不是扩容。再往后发展的话,是不是可能能够根据历史分析业务应用的场景,如果能够把这样的一些算法写到存储智能管理当中,未来存储就会变得更加聪明,更加智能。

云化世界,切忌云山雾罩,听叶大师指点迷津

未来的世界是云的世界,从私有云、混合云到容器化、DevOps的变化,数据存储如何与之匹配和适应。

宋家雨:云计算是毫无争议发发展方向,云环境以分布式存储为主,全闪存阵列在云环境里,还有戏分吗?

叶毓睿:相信也会增加,云化是未来发展趋势,应用初期,用户在选择场景应用的时候可能会更多选择一些边缘、非生产系统。但是使用习惯逐步深入,渐渐也会考虑跟交易相关的、一些生产系统也会转移到云化环境中,对性能、低延时也会提出相应的挑战和要求。所以,我相信无论混闪、全闪也会在云化环境中逐步提高。可以看到,国内一些公有云目前在提供高性能存储空间。

谈到云化,有两个大IT趋势,一个是混合云,还有就是容器化。在混合云部分,私有云还是占更大比例,为什么会有大量数据存放在私有云呢?我觉得其实有很多的因素,如说隐私数据保护、数据响应、数据合规性,还有很重要一点是用户使用习惯,譬如原有业务是在大机、后面在小机,再到x86,使用Web+中间件+数据库的三层的结构,用户要从这样的形态迁移云原生应用,要投入的时间和精力,涉及使用习惯的改变,这会是非常大的阻碍。

浪潮存储做出了很好尝试,比方集中式存储以及云网关,相当于云分层,或者叫云归档。什么意思呢?如果需要频繁访问,从本地集中式存储提供。可以把那些长期不怎么使用的数据,可以归档到公有云,如果数据又需要读取,为了避免读取速度缓慢,就会从公有云再把数据拉回本地集中式存储。

在私有云创建过程中,对存储提出了一个挑战,要求存储应该是软件定义的存储,现在有两大平台选择,一个是开源平台,一个是商业的平台。在开的平台里,像OpenStack这样的云管理软件,Cinder是块接口,Manila是文件接口,Swift就是对象接口。需要有相关API去支撑,符合这种标准和规范。

商业平台以VMware为代表,需要支撑VAAI以及NAS接口。

浪潮存储能够较好应对以上的挑战,如浪潮AS13000,能够同时支持文件、块和对象。有些其实是两套不同存储,只是通过图形管理界面管理起来。浪潮是在分布式最小三个集群节点数去构建不同数据池,就可以实现对私有云,对软件定义存储的支持。

针对容器化。像金融行业、电信行业、互联网行业,还有像汽车自动驾驶,以及物流行业等很多行业,已经开始部署容器化,使得他们能够去实现DevOps,能够敏捷应对前端瞬息万变的业务对IT资源的需求。与容器化关联,就是存储怎么样能够支持到容器编排调度工具,去分配相应持久化存储空间,对逻辑卷的需求达到数千个,数万个。

对此,不可能按照原始方式,每个都进驻到图形管理界面,或者是一个命令行去把这些容器的持久化卷创建出来。这时候需要让前端容器编排调度工具去驱动,去创建。目前,浪潮不管是集中式的存储,还是分布式存储,都能够支撑CSI(Container Storage Interface)。

相关文章