顾名思义,数据仓库从多个来源收集不同的数据,可以在其中进行查询、分析和挖掘以获取情报。将其保留在本地、公共云或混合云可能是一个令人担忧的决定。 Vertica首席技术官Rohit Amarnath解释了DWaaS(数据仓库即服务)模型提供的权衡和选项。
随着移动应用、物联网 (IoT) 和数字消费者互动的爆炸式增长,数据正以前所未有的速度和规模生成。显然,企业希望捕获和使用这些数据,因为它们可以揭示消费模式,提供更大的个性化和参与度,并为客户提供量身定制的产品和服务。
也就是说,存储、维护和分析如此大量的数据可不是开玩笑的。在过去几年中,由于云弹性商业模式获得的成本和便利性,普遍的转变是在云中收集这些数据。数据通常暂存在云对象存储(现在也称为数据湖)中,并使用云数据仓库进行分析。
这些云数据仓库(和“数据湖仓”)通过利用云优势的创新(如计算和存储的分离)而变得越来越复杂。如今,大多数云提供商和数据仓库供应商都提供基于公共云的数据仓库服务(又名数据仓库即服务或DWaaS),并采用基于消费的定价。组织将设置、维护、保护或升级数据仓库以及所有相关软件和硬件堆栈等无差别的繁重工作留给云供应商。
DWaaS 产品具有不同的选项,选择正确的选项可能取决于业务用例。因此,作为整体决策过程的一部分,组织应仔细评估以下几点的DWaaS:
软件限制
当软件被开发为作为服务提供时,包括自助服务和易用性,它需要与平台的稳定性和安全性相平衡。其他因素(包括各种云提供的功能)可能会影响服务可以提供的功能或能力。
例如,云对象存储的性能和功能可能有所不同,这可能意味着 DWaaS 在不同云之间的性能可能不同,或者仅支持一种云类型。一些提供商仅使用云,这意味着如果需要(出于合规性或安全原因),他们将失去处理本地或混合工作负载的能力。
如果 DWaaS 是由供应商托管的完整黑匣子,这可能意味着调优和配置的透明度和灵活性降低。确保您了解这些因素对工作负载的影响。通常,大多数工作负载可以找到提供正确类型功能组合的服务。根据我的经验,如果用例特别复杂,客户就有资源进行构建和自我管理,但这种情况也在发生变化。
并发数据系统很难
大多数 DwaaS 都是基于群集的多节点平台。并发系统本质上是复杂的,并强加了如何配置云基础架构的规则。这可能包括节点的数量,或者节点如何扩展或缩减,或者节点间通信的布局方式。
这可能是有限制的,但规则通常是出于正当理由存在的 - 通常是复杂并发系统通信和数据传输的稳定性,同时处理随时可能发生的故障。记住这句格言——“一切都在云中失败”;如何处理故障定义了系统针对云的架构程度。供应商有他们的工作要做,以确保在云基础架构级别最大限度地提高灵活性,使云中的数据仓库更容易。
混合限制
研究Opens a new window 表明许多企业也在考虑采用混合云。安全、隐私和法规显然是主要驱动因素,但除此之外,总成本Opens a new window 仅云方法的所有权可能高于在本地运行的所有权,但需要权衡灵活性。
某些 DWaaS 产品/服务没有本地等效功能,这可能使企业有必要运行多个数据仓库。这种复杂性会大大增加主要分析程序的运营和编排成本。
安全注意事项
没有人会否认DWaaS模型很方便。还有什么比让其他人管理所有内容而您只专注于分析、仪表板和报告更容易的呢?但是,选择 DWaaS 可能会导致某些提供商对您的数据的访问权限超出应有的水平。也就是说,一级DWaaS供应商利用并实施加密和加密控制,将仓库的操作与对数据的访问分开。这些供应商还实施安全控制,使其符合 ISO27001 和 SOC II 等安全标准,使您能够信任他们的安全实践、流程和策略来维护和保护您的数据。
隐藏费用
预算超支是一个常见问题Opens a new window 说到云。由于缺乏使用可预测性、复杂性增加以及云固有的弹性,云费用可能会迅速失控。注意与基于消耗的使用情况和性能相关的隐藏费用。
DwaaS 业务模型的入门定价较低,但一旦数据意外增长或需要额外的计算能力,请准备好密切监控由此产生的成本。安全功能可能仅在更高级别的服务中可用,并且会产生明显的费用。
供应商锁定
大多数人认为从一个DWaaS移动到另一个DWaaS很容易,但事实并非如此。每个平台都需要大量的迁移工作,尤其是在涉及一些自定义的情况下。DWaaS 供应商还销售大量附加服务,以将客户锁定在复杂的部署中,而这些服务通常很难在其他平台中复制。许多云提供商收取出口费用,以防企业想要迁移到另一个云或将其工作负载迁移到本地。坚持使用基于 SQL 的标准关系数据仓库可以更轻松地移动工作负载。
总而言之,DWaaS 可能对许多组织都很有意义。与本地数据中心相比,它们的优势包括减少人员需求、易于扩展和降低 IT 成本。人们应该考虑他们的数据工作负载,并查看利用云优势的数据仓库参与者,例如计算和存储分离、基于消费的定价、安全认证和控制、定价透明度和灵活的部署模型。