1. 概念
元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
举几个简单例子:
- 如果一本书是一个“数据",那么它的书名、封面、出版社、作者、总页码就是它的“元数据”。
- 如果一个电影是一个“数据”,那么它的总时长、制作人、总导演、演员列表就是它的“元数据”。
- 如果数据库中某个表是一个”数据”,那么它的列名、列类型、列长度、表注释就是它的"元数据"。
只要有一类"事物",就可以定义它的“元数据”。
大多数时候,元数据可以根据代表意义的不同分为业务元数据和技术元数据(有时还会有[管理元数据]的概念)。
2. 基本特点
元数据一经建立,便可共享。
元数据首先是一种编码体系。
3. 业务元数据、技术元数据和管理元数据
-
业务元数据
业务元数据主要描述 ”数据”背后的业务含义;从业务角度描述业务领域的相关概念、关系——包括业务术语和业务规则。
业务元数据,在实际业务中,需要不断的进行维护且与业务方进行沟通确认。
-
技术元数据
指技术细节相关的概念、关系和规则,包括对数据结构、数据处理方面的描述。以及数据仓库、ETL、前端展现等技术细节的信息。
数据仓库中的技术元数据一般包含以下 4 大系统:数据源元数据;ETL 元数据;数据仓库元数据;BI 元数据。
- 管理元数据
管理领域相关,包括管理流程、人员组织、角色职责等。
也有很多观点建议将 管理元数据拆分融入 业务元数据和技术元数据中。
4. 在数据仓库中的应用
在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:
- 描述哪些数据在数据仓库中;
- 定义要进入数据仓库中的数据和从数据仓库中产生的数据;
- 记录根据业务事件发生而随之进行的数据抽取工作时间安排;
- 记录并检测系统数据一致性的要求和执行情况;
- 衡量数据质量。
参考资料:
百度百科:元数据
什么是元数据?为何需要元数据?
浅谈数仓的元数据管理
相关文章
暂无评论...