现代数据管理的核心思想是基于以下两个主要驱动力来改进数据驱动型业务洞察的生成:
- 通过自助服务举措(减少IT瓶颈)使数据分析过程变得更加敏捷。
- 使任何信息都可以被用于进行分析。
然而,任何组织都拥有大量用于关注业务不同方面的应用程序和系统,从供应链管理到营销自动化,以及各种数据系统,如数据仓库、数据集市和数据湖。
为了有效地实现上述目标,必须对这个复杂的数据环境进行高效管理。快捷的数据集成、数据发现、安全和管理等主题是任何现代数据策略的首要任务。
为了有效地实施这些需求,企业已经转向两种不同的方法:
- 基于物理数据整合的集中式数据策略
- 基于跨不同系统的数据整合视图的逻辑数据策略
逻辑数据架构和管理能够访问多个不同的数据源,同时对用户呈现为一个“逻辑”数据源。它旨在统一存储和管理在多个数据管理系统中的数据,包括传统数据源(如数据库、企业数据仓库、数据湖等)以及其他数据源(如应用程序、大数据文件、Web 服务和云),以满足所有分析用例。
逻辑数据管理允许通过逻辑(或虚拟)表示来执行数据发现、访问、安全、集成和共享等实践,而不是直接在每个物理源系统上执行。逻辑数据管理实践能够一致地实施策略和实践,以管理、集成和使用组织的数据,而不管每个源系统的性质、位置和功能如何。
虽然逻辑方法有明显的优势,但组织有时需要采用单体方法来满足特定的业务需求,两种方法都可以作为整体敏捷数据管理策略的一部分进行统一部署。
商业视角
- 一站式数据中心: 逻辑数据层将您的数据集中化,使您能够实时访问所有数据,包括本地存储和云存储的数据,并保持语义一致性。
- 面向业务的视图: 通过逻辑数据层,组织可以轻松创建面向业务的自助服务数据视图。这是通过消除传统上复杂的数据集成技术、格式、协议和位置细节来实现的,使数据更容易获得和用户友好。
- 提高数据利用率: 使非技术用户能够快速查找、访问、集成和共享数据。使业务领域的专家能够参与数据建模过程,并缩短创建可立即使用的数据所需的时间。
IT 视角
- 实时数据: 逻辑数据层使利益相关者能够按需访问最新的数据,随时以首选格式获取数据,以支持各种业务用例。企业不再需要等待夜间批处理运行来刷新他们的数据集。
- 减少数据蔓延和重复: 通过逻辑数据层消除不必要的数据复制,组织可以提高敏捷性、降低风险和减少成本。
- 更快的数据交付: 逻辑数据层能够加速新数据集的供应,使组织能够跟上不断变化的数据需求。
- 集中式安全和治理: 通过一个包含对所有企业数据的访问的单一层,对所有数据集中的每个用户执行安全和管理数据控制变得更加容易。
为了成功实施逻辑数据架构和管理方法,组织只需要一种能力:
数据虚拟化是一种数据集成和数据管理技术,它利用元数据使组织能够实时访问所有企业数据,以及发现、编目、供应、组合、共享和治理数据以满足各种用例。