摘要:但是,由于数据库在提取数据之前不需要应用架构,因此它们可以保存大量和种类繁多的数据,而费用仅是数据仓库的一小部分。在以新颖方式利用数据的能力提供关键的竞争优势的市场中,重点不应再放在数据库与数据仓库之间。

如今,大多数企业都有一个数据仓库,可以通过各种BI工具访问该数据仓库,以辅助决策过程。这些已经使用了几十年,并且很好地满足了企业数据要求。

但是,随着所收集数据的数量和类型的扩展,使用这些数据还可以做更多的事情。其中大多数是企业甚至可能尚未确定的用例,只有在他们有机会实际处理数据之前,他们才能做到这一点。

那就是数据库的入口。在此博客中,我们将对数据库与数据仓库的争论进行更深入的探讨,并尝试了解是用新旧替代旧存储还是两者互补。

数据库与数据仓库

数据仓库和数据库在三个关键方面有所不同:数据结构

就数据的存储方式而言,数据仓库与实际仓库非常相似。一切都被整齐地标记,分类并以特定顺序存储。同样,企业数据在被接受到数据仓库之前,首先要进行处理并转换为特定格式。同样,数据仅来自选定数量的来源,并且仅为一组预定的应用程序提供动力。

另一方面,数据库是一个庞大而灵活的存储库,可以在其中存储未经处理的原始数据。数据大部分为非结构化或半结构化格式,有可能被任何现有业务应用程序使用,或企业将来可能想到的应用程序。

数据结构的差异还转化为数据库的关键成本优势。清理和处理原始数据以在其上应用特定模式是一个耗时的过程。而且,日后更改此架构也是费力且昂贵的。但是,由于数据库在提取数据之前不需要应用架构,因此它们可以保存大量和种类繁多的数据,而费用仅是数据仓库的一小部分。目的

数据仓库需要结构化的数据,因为已经定义了如何使用该数据。由于数据的清理和处理已经很昂贵,因此数据仓库的目的是要尽可能有效地利用存储空间。因此,关于将交付给哪些业务应用程序的信息,每个数据的目的都是一致的。这样可以确保空间得到优化。

数据流入数据库的目的尚未确定。这是一个收集和保存数据的地方,稍后将决定在何处以及如何使用它。通常取决于如何探索和试验这些数据,以及企业内部创新产生的要求。辅助功能

与数据仓库相比,数据库总体上更易于访问。数据库中的数据以原始格式存储,因此可以轻松访问和更改。另一方面,数据仓库中存在的数据需要花费大量时间和精力才能转换为其他格式。在这种情况下,数据操作也很昂贵。数据库会取代数据仓库吗?

不会。数据库很可能不会取代数据仓库。相反,这两种选择是相辅相成的。

数据仓库中信息的有组织存储使获取可预测问题的答案变得非常容易。当您知道业务涉众需要某些信息或定期分析特定数据集或指标时,数据仓库就足够了。它被构建为吸收模式中的数据,该数据将快速给出必要的答案。例如,数据仓库可以处理特定区域的收入,销售额,同比增长,业务绩效趋势。

但是,随着企业开始收集更多类型的数据,并希望从中探索更多的可能性,数据库成为至关重要的补充。

如前所述,在将数据加载到数据库之后,将模式应用于数据。通常在将数据用于特定目的时执行此操作。数据如何适合特定的用例,将决定将哪种模式投影到其上。这意味着,一旦加载数据,就可以将其用于各种目的,并用于不同的业务应用程序。

这种灵活性使数据科学家可以对数据进行实验,以找出可以利用的数据。他们可以建立快速模型来解析数据,识别模式,评估潜在的商机。与原始数据一起创建和存储的元数据可以尝试不同的模式,以不同的结构化格式查看数据,以发现哪些对企业有价值。

鉴于数据库的这些特征,它可以通过几种不同的方式扩展数据仓库:

开始探索您收集的数据的潜力,超越当前数据仓库的结构化能力。您可以使用这些数据资产来创建新产品和服务,甚至可以改善当前流程。(例如,利用数据库来收集网站访问者的信息,并利用这些信息来推动更个性化的买家旅程和不断发展的营销策略。

在将大型数据集输入到数据仓库之前,可以将其用作 准备环境来处理大型数据集

轻松处理流数据,因为数据库不仅限于基于批处理的定期更新。

最重要的是,数据仓库仍然是企业数据体系结构的关键部分。它使您的BI工具保持运行状态,并允许不同的涉众快速访问他们所需的数据。

但是数据库的实施进一步增强了您的业务,因为:

无论结构或质量如何,您都可以访问大量可以存储以供使用的数据

存储具有 成本效益,因为它消除了存储前处理数据的需要

数据可 用于多种用途,而不必承担将其重组为不同格式的费用

通过不同的模型和应用程序运行数据的灵活性 使识别新用例变得更加轻松快捷。

在以新颖方式利用数据的能力提供关键的竞争优势的市场中,重点不应再放在数据库与数据仓库之间。如果企业想保持领先地位,就必须实现数据仓库和数据库的互补功能,并努力建立一种能够从两者中获得最大收益的模型。

相关文章