随着大数据、人工智能、物联网、5G等科技手段的不断推进,人们已经进入数据互联的时代。在数据需求日渐强烈的当下,数据采样的方式逐渐增多,产生的数据量也快速增长。同时,基于数据挖掘和智慧应用,数据的生产者也不再只有人和设备,数据本身也参与到了生产数据的环节中,成为了新的数据生产者,数据总量将呈指数级增长。

数据来源广泛,它对存储有什么要求?IT人员如何管理这些迅猛增长的数据呢?

新数据时代对海量数据的存储系统提出严苛要求

一.高密度、大容量、可扩展。数据的爆发式增长和保存周期的延长,带来了对存储空间的直接需求。传统的存储架构已经无法解决如此大数据量的存储空间问题。需要一套PB级扩展性、支持十亿级文件并支持多种服务接口的新型存储系统,满足海量、多元化数据存储的同时,实现跨平台无障碍对接。

二.高可靠、高可用。存储系统承担着用户的核心数据,与业务系统交互频繁,一旦出现故障,将直接影响业务系统的运行状态,甚至引发数据完整性、安全性问题。而大规模存储系统,硬件故障将成为常态,对存储集群的负载均衡、数据冗余、系统重建和故障排除都有着较高要求,如何有效的避免故障和高效的管理、处理故障就显得尤为重要。

宝德分布式存储应运而生

面对挑战,宝德发布了“基于存储服务器的大规模数据中心级分布式存储系统PL-XDFS”,帮助用户解决海量数据的存储问题,为用户的数据中心打造面向未来的存储平台。

首先,宝德分布式存储系统基于Scale-Out架构实现了容量极致扩展。宝德分布式存储系统PL-XDFS,通过Scale-Out横向扩展的基础架构,实现最高1024个集群节点,可形成PB级海量存储空间,支持十亿级数据文件管理。系统通过海量存储系统对底层硬盘资源进行池化,形成统一资源池,同时提供文件存储、对象存储、块存储、大数据四种存储服务,支撑上层多种应用,承载多元化的海量数据。依赖横向扩展架构,存储性能随容量扩展而线性提升,从而达到高IOPS和高带宽的极致性能。

其次,宝德分布式存储依托多项高级功能优化容量资源利用率,基于业界领先和广泛使用的GlusterFS分布式文件系统,结合宝德技术团队多年的工程化及系统优化经验,在研发过程中实现多项技术突破,并演进迭代成为功能特性,进一步提升规模集群的整体可用性、可靠性。一是高可用。宝德存储提供副本和纠删码两种数据/集群保护模式,用户可根据应用类型、 数据重要性、性能、成本平衡选择不同的配置模式,实现数据高可用保护和存储服务高可用保护。二是数据均衡。宝德存储采取全局一致性容量均衡技术,通过每个硬盘引用计数,保证数据在集群所有硬盘中均匀分布。三是快速数据定位。宝德存储采用无元数据服务设计,取而代之使用弹性 Hash 算法来定位文件, 从根本上解决元数据管理这一难题,从而获得近乎无限规模的线性高扩展性,同时也大幅提高了系统性能和可靠性。

极致容量下的极易管理

存储集群在大规模部署的情况下,运维的量级和难度对用户来说是极大的挑战。宝德分布式存储系统采用大数据和AI技术,构建智能化运维管理平台,实现对存储平台自动化部署、状态检测、容量预测、性能优化、故障诊断等智能化运营,解决大规模IT系统运维难题,提高运维效率,降低运维成本,优化用户体验,保障业务连续性。

宝德存储围绕解决数据存储问题,在“存得下”的基础上,充分考虑大规模存储集群对成本和硬件故障的敏感性,在低投入的情况下实现高容量的数据存储,并且通过多种功能特性给予存储系统更高的可靠性、安全性和可用性,进一步实现“存得稳”、“管得全”。

相关文章