数据、元数据、主数据概念解释

上传人:re****.1 文档编号:470517030 上传时间:2023-11-10 格式:DOCX 页数:9 大小:251.15KB
返回 下载 相关 举报
数据、元数据、主数据概念解释_第1页
第1页 / 共9页
数据、元数据、主数据概念解释_第2页
第2页 / 共9页
数据、元数据、主数据概念解释_第3页
第3页 / 共9页
数据、元数据、主数据概念解释_第4页
第4页 / 共9页
数据、元数据、主数据概念解释_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据、元数据、主数据概念解释》由会员分享,可在线阅读,更多相关《数据、元数据、主数据概念解释(9页珍藏版)》请在金锄头文库上搜索。

1、数据、元数据、主数据概念解释元数据、主数据是数据治理的核心。元数据、技术元数 据、业务元数据、操作元数据、主数据、参考数据、事务数 据、业务数据、维度、度量、指标等概念层出不穷,如何理 解其中复杂的关系成为困扰很多数字化人的问题之一。按照数据的记录、管理和分析三个用途,对这些数据名 词进行归类如下:事一、记录类数据1.事务数据事务是数据库的处理数据的一个单元,可以理解为一次数据库 CRUD 的操作。事务数据就是记录下数据库操作的系 统日志数据,以及特定业务场景中,专门记录的业务操作事 务记录的数据,比如用于安全审计的系统登录日志。2.业务数据业务数据就是为了完成业务流程而存储的业务操作类 数据

2、。就是业务系统的绝大多数表和数据。3.日志数据早期的日志数据是属于事务数据中的。现在大数据时代 用户访问数据变得越来越重要,所以单独分离出来。二、管理类数据1.元数据元数据又称中介数据、中继数据,为描述数据的数据, 主要是描述数据属性的信息,用来支持如指示存储位置、历 史数据、资源查找、文件记录等功能。元数据算是一种电子 式目录,为了达到编制目录的目的,必须在描述并收藏数据 的内容或特色,进而达成协助数据检索的目的。通俗来讲,只要能够用来描述某个数据的,都可以认为 是元数据。举个例子,如果你把一部电视剧看做数据,那么 你在电视剧里面获取到的信息,比如角色名、剧情、主题曲、 感情线、导演、演员等

3、等,都可以被看做是这部电视剧的元 数据。对于企业而言,元数据是跟企业所使用的物理数据、业 务流程、数据结构等有关的信息,描述了数据(如数据库、 数据模型)、概念(如业务流程、应用系统、技术架构)以 及它们之间的关系。同理,现在我告诉一个数字:175,你除了对 175 这个 数字有比较确定的量化意义之外,也无法理解 175 具体代表 了什么含义。但是如果是这样描述一下呢?数据值175指标cm平均身高统计时间2020 年区域范围 人群范围全国成年男性I圍值数据库类型80-260MySQL数据库连接 实例名XXXXXXStatistic表名字段huma rustatHeight_avg数据接口 创建

4、人http /XXXX张三创建时间2020年1月1日修改时间 下2020年1月1日数据权限公开寺伞等I 更荃这样是不是就很清楚了? 175的意思是:2020年统计的 全国成年男性平均身高,该值的合理阈值是80-260cm,数据目前存在MySQL中,访问连接是XXXX,由国家统计局的 张三在 2020年 1月1日创建,数据目前是公开的,很安全, 质量经过多重确认无误的。在描述175这个数据,用了哪些描述项呢?单位、指标、 统计时间、统计范围、合理阈值、数据库、表、字段、接口、 创建人、创建时间、数据权限、质量等级等等。这些都是在 描述 175 这个数据。我们把描述 175 这个数据的其他数据称

5、之为“元数据”。当然,为了管理方便,我们同样还能将上述元数据进行 归类:元数据类型!数据类型数据内容数据值175业务元数据单位cm指标平均身高统计时间2020年区域范围全国人群范围成年男性阈值80-260技术兀数据数据库类型MySQL数据库连接XXXXXX实例名Statistic表名human.stat宇段HeighLavg数据蓿口httn/XXXX操作元数据创建人张三创建时间2020年1月:L日修改时间2020年1月1日数据权限公开菅理元数据1专仝等级寺.,仝与业务规则、流程相关的描述性数据,我们称之为业务元数据;与存储、访问等技术底层的描述性数据,我们称之为技术元数据;与数据操作相关的描述

6、性数据,我们称之为操作元数据与数据管理相关的描述性数据,我们称之为管理元数据元数据可以解决什么核心问题?元数据是为了准确的描述我们拥有的所有数据。其核心的目的是降低人与数据之 间的沟通成本。描述的越准确,我们使用数据的成本就越低2.主数据主数据(Master Data)就是关于业务实体的数据。主数 据是关键业务实体的最权威、最准确、价值最大的数据,用 于建立交易闭环。对于 CRM 客户管理系统来说,用户就是主数据;对于 银行来说,卡 bin 码、开户行、账号、理财产品等都是主数 据;对于生产企业,BOM表是主数据;对于二手房平台, 房源信息是主数据。贝壳的楼盘字典就是典型的主数据,他 们从20

7、08年开始建设,持续了 12年,投入了5、6亿。1房喪O3干r觥脳坐标i曲拿 琴対鮭卑却秤*七(QUBBEXiEl厂国 同呼1 粤怪吧_5 T1?37级门址营18Erb门信E产则駅廖呂白雄府 小苗何苕hffiifcl raiUi用很医丹邙出呆也忌押血章I耶EHk茲旬卡恂跛姐君花弘U4KS小1喝堀:所以总结一下,主数据一共有以下种类:与人相关的:用户、客户、公民、病人、供应商、学生 等;与物相关的:实体产品、虚拟产品(理财产品)、生产资料(BOM表)等;与场相关的:地址库、楼盘字典、POI信息等;与规则相关的:财务的账套等。在传统 IT 企业,甲方公司的主数据可以立一个千万级的 项目。国内也有很

8、多公司专门做主数据这个行当。主数据的 核心思想是全局唯一的标准数据。因此,主数据一般会完成 以下工作:确定核心业务环节识别主数据定义和维护主数据匹配 规则(代码规则、ID Mapping)建立及发布数据标准主数据 的后续维护及更新。3. 参考数据参考数据是增加数据可读性、可维护性以及后续应用的 重要数据。参考数据是对数据的解释,针对一些数据范围和 取值的数据解释, 让人们容易读取相关的数据。比如,在 一些数据里“性别”的这个字段,很可能是 1 代表男性、 2 代表女性。在许多企业中有这样的约定俗成,而更多的参考 数据可能记录在开发人员和运营人员的大脑当中。但问题是 一旦这些人离开,系统里面的数

9、据就成了堆没有注释的天书 参考数据约等同于数据字典。正是由于这些数据字典局仅限 于个别系统而没有统一标准,从一个侧面间接造就了大量的 数据孤岛。企业为了进行更有效率的数据整合、数据共享和 数据分析应用,开始尝试对参考数据进行企业或者部层面的 整合和管理,利用参考数据集记录系统尝试为范围内的 IT 系统中的数据库提供统的参考数据。4. 元数据与主数据的区别元数据是关于数据的数据,当人们描述现实世界的现象时,就会产生抽象信息,这些抽象信息便可以看作是元数据, 元数据主要用来描述数据的上下文信息。通俗的来讲,假若 图书馆的每本书中的内容是数据的话,那么找到每本书的索 引则是元数据,元数据之所以有其它

10、方法无法比拟的优势, 就在于它可以帮助人们更好的理解数据,发现和描述数据的 来龙去脉,可以帮他们形成清晰直观的数据流图,元数据是 数据管控的基本手段。主数据则定义企业核心业务对象,如客户、产品、地址 等,与交易流水信息不同,主数据一旦被记录到数据库中, 需要经常对其进行维护,从而确保其时效性和准确性;主数 据还包括关系数据,用以描述主数据之间的关系,如客户与 产品的关系、产品与地域的关系、客户与客户的关系、产品 与产品的关系等。主数据跟元数据的关系,举个例子的话就像是一本书, 主数据就是书里边的正文,实际有用的数据,元数据就是书 的目录,是索引,方便你找到主数据的。一般而言,企业中这三类数据与其它数据的数据量、质 量需求,更新频率、数据生命周期的关系大致如下图:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 机械/制造/汽车 > 电气技术

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号