数据编织背后的一个关键思想是,能够通过一个易于使用的中心化接入点访问组织中的任何数据资产。最终用户不必应对幕后的复杂数据生态系统,也不需要了解组织中每个数据库和应用程序的实质细节。
数据虚拟化层可以实现这一点,它可以抽象出复杂性,并提供中心化的接入点。除了集中访问之外,该层通常还提供其他功能,如缓存、安全、建模和跨源联合等,能够在整个组织中统一实施。即使公司数据分散在数十个异构系统中,这些功能仍将让最终用户感觉,所有数据都整合并存储在单一系统中。
数据编织供应商采用两种主要架构提供这种功能:
- 专用数据虚拟化层
- 具有数据虚拟化扩展的数据引警
在这份白皮书中,我们将详细探讨这两种架构,并重点关注这些实现决策对查询执行性能的影响。
为进一步说明这两种架构之间的差异,我们使用 TPC-H 展开广泛的基准测试,展示这两种架构在不同场景下的表现。
您可以在下面的“基准测试”小节中找到测试方法和环境规格的详细说明。