摘要:为了解决这个问题,第三代云数据仓库旨在提供一种服务,该服务非常适用于数据量高且查询复杂性多变的用例,以及组织希望为每个业务决策者提供实时访问的情况所有相关数据。第一代数据仓库除了部署简单之外还提供许多好处:它们可以随着业务需求的变化而扩展和缩小,它们是数据集成和应用程序开发生态系统的一部分,可以构建新的应用程序类,并且它们构建于一个专为弹性和安全性而设计的平台。

数据仓库的重要性日益增加,因为我们可以使用的数据量呈指数级增长。我们看看他们的历史,他们在哪里,以及他们去哪里。

在当今世界,数据正在快速生成,尤其是几乎每个行业的企业都经历数字化转型。我们也看到了前所未有的需求,使每个业务决策者都能够访问实时数据,以便他们能够为业务做出最明智的决策。全球公司比以往任何时候都更多地将虚拟团队分散到世界各地,使他们能够使用所有可用数据做出明智的业务决策。例如,零售商不仅要考虑过去的购买和浏览历史,还要使用所有公开的客户信息,例如他们的专业和雇主,他们的观看和收听兴趣,体育和爱好,旅行模式和餐馆。经常光顾。

为了使数据对业务具有可操作性和有用性,公司需要一种以高效且经济高效的方式存储,标记和分析数据的方法。输入数据仓库。

“数据仓库”一词是由美国计算机科学家Bill Inmon在20世纪70年代创造的。第一批数据仓库诞生为内部部署服务器,旨在以千兆字节的规模运行。现代手机比最早的数据仓库拥有更多的存储和处理能力。今天的数据仓库必须从头开始构建,以便在相当交互的响应时间内容纳数PB的数据。由于最早的云数据仓库在当今分析工作负载的压力下显示其年龄和吱吱声,我们看到硬件被交易以获得更灵活的软件,数据仓库已经迁移到云端。这种演变导致了三代不同的云数据仓库。

过去 - 一世

第一代云数据仓库消除了设置支持群集MPP数据仓库所需的相当复杂的基础架构的复杂性。不仅预先配置了硬件和操作系统环境,数据仓库也是如此。亚马逊Redshift等技术被预示为改变未来数据仓库的部署方式,并且采用率迅速提高。

第一代数据仓库除了部署简单之外还提供许多好处:它们可以随着业务需求的变化而扩展和缩小,它们是数据集成和应用程序开发生态系统的一部分,可以构建新的应用程序类,并且它们构建于一个专为弹性和安全性而设计的平台。

但是,它们可能是有限的。由于第一代云数据仓库仅提供云版本,因此该技术的采用者需要找到替代解决方案,以便出于合规性或敏感性原因必须驻留在本地。与其他相关服务集成的承诺伴随着价格 - 将它们连接在一起可能既困难又耗时。

第一代云数据仓库中存储和计算的紧密耦合意味着在不影响存储的情况下关闭计算是不可能的,因此仪表始终在运行。对于那些工作时间访问分析就足够的用例,这可能会成本过高。虽然定价可能开始较低,但规模化的生产工作量可能会变得昂贵。

第一代云数据仓库由云平台提供商提供,其部署通常仅限于他们自己的云平台(RedShift仅限于AWS,Big Query仅限于Google Cloud等)。当业务需求需要替代方案时,这可能是一个挑战。

现在 - 第二代

对第一代云数据仓库的巨大需求清楚地表明,除了云平台提供商之外,还有巨大的市场机会和空间。

第二代云数据仓库具有云基础架构的所有优势,例如可扩展性,安全性和健壮性,但它们不像本地第一代仓库那样与单个云提供商绑定。它们还解决了第一代的一些缺点。它们提供完全托管的云数据仓库服务,客户可以专注于发展业务,而不是专注于自己的数据基础架构。它们还提供了更真实的云经济学,期望您只需支付使用的费用。由Snowflake等公司定义的第二代云数据仓库已经永远改变了企业数据仓库的经济性。

但第二代数据仓库有其自身的局限性。它们是云原生解决方案,与第一代一样,意味着需要选择第二种技术来满足内部数据需求。此外,随着额外的计算集群不断涌现以满足不断增长的用户需求,它们的成本开始较低但却迅速上升。

未来 - 第三代

许多组织的一个关键要求是,软件服务提供了一个内部部署等效项,可以在云中运行相同的技术,技能和应用程序,以及可能受监管要求约束的敏感数据的内部部署。还应该能够从单个查询中无缝地将云数据仓库中的数据与其内部部署备选方案相结合。这是第三代数据仓库的用武之地。

第三代数据仓库通过允许数据同时存储在内部和云中,将所有数据连接到更广泛的数据生态系统(无论位于何处)并允许组织利用其数据提供的实时洞察力来解决这一挑战 - 所有他们的数据。这种混合能力是其主要区别之一。这对于具有法规遵从性要求的行业(如金融服务,医疗保健和制药)尤其重要,这些行业希望利用相同的技术满足其内部部署和云分析需求,以及无缝加入内部部署和云驻留数据。这也允许为云和内部部署使用相同的技能,技术和应用程序,

早期的几代人也在努力在企业规模上运行混合工作负载的大量用户。为了解决这个问题,第三代云数据仓库旨在提供一种服务,该服务非常适用于数据量高且查询复杂性多变的用例,以及组织希望为每个业务决策者提供实时访问的情况所有相关数据。第三代产品旨在成为更广泛的云战略中的一个组件,并与数百个数据源集成,包括流行的SaaS解决方案,如Salesforce,NetSuite,Workday和ServiceNow,因此来自这些服务的数据可以无缝混合以提供见解。

此外,以前的云数据仓库遇到了并发问题。第三代解决方案专为需要容纳数百名用户并行查询数据的顶级企业而设计。为大量用户和海量数据执行复杂查询对于第三代数据仓库来说是个孩子的游戏。拥有强大的并发功能,无需成本扩展,因为用户可以访问数据,这意味着组织可以真正地大规模利用每个业务功能中的数据,以提供可操作的见解。

多年来,数据仓库已经发生了变化,从内部部署的主力解决方案开始,然后转变为云 - 每次新的迭代都解决了之前提出的问题。

在第三代中,我们将数据仓库视为混合解决方案,将内部部署和云数据的功能相结合,以利用实时洞察力。第三代仓库是为那些希望为其业务决策者提供他们做出明智决策所需的所有信息的大型企业而设计的,无论这些信息可能存在于何处。展望未来,我们预计会有更多组织采用第三代的力量。

相关文章