常有客户问及,“何时该使用数据虚拟化,何时又该使用 ETL 工具?” 类似的问题还有“数据虚拟化是否要取代 ETL?”或是“我已经有了 ETL,为何还需要实施数据虚拟化?”这些问题都将在本 Denodo 架构概 要中得到解答。
提取,转换和加载(ETL)是物理数据整合项目的一个很好的解决方案,可将数据从原始数据源复制到企业数据仓库(EDW)或新数据库中。
这包括:
- ETL工具旨在从大型结构化数据源中批量复制包含数百万行的超大型数据集。
- 创建数据的历史记录,例如在特定时间进行快照,以分析数据集如何随时间变化。
- 执行复杂的多遍数据转换和清理操作,并将数据批量加载到目标数据存储中。
事实是,尽管两种解决方案不同,但数据虚拟化和ETL通常是互补的技术。数据虚拟化可以通过多种方式扩展和增强ETL / EDW部署,例如:
- 用新的数据源扩展现有的数据仓库
- 联合多个数据仓库
- 充当虚拟数据源以增强ETL流程
- 隔离应用程序,使其免受对基础数据源的更改(例如,迁移数据仓库)