数据治理那些事(10)

上传人:鲁** 文档编号:498204695 上传时间:2023-12-07 格式:DOCX 页数:5 大小:59.13KB
返回 下载 相关 举报
数据治理那些事(10)_第1页
第1页 / 共5页
数据治理那些事(10)_第2页
第2页 / 共5页
数据治理那些事(10)_第3页
第3页 / 共5页
数据治理那些事(10)_第4页
第4页 / 共5页
数据治理那些事(10)_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据治理那些事(10)》由会员分享,可在线阅读,更多相关《数据治理那些事(10)(5页珍藏版)》请在金锄头文库上搜索。

1、数据治理那些事(10)企业数据字典2上节主要讲的数据字典的组成和意义,本节主要以实际案例讲下企业级数据字 典及实际应用,这是我参加某一个金融企业的新一代的数据项目群中的案例,下面具 体说明企业级数据字典作用如下:1. 统一企业级“数据项”的业务认识;2. 规范企业级“数据项”的技术格式;3. 规范企业级“数据项”的名称,特别是“英文简称”;4. 统一规划及管理“企业级数据项”;5. 作为检查数据项规范性的基准;H录内容词忙基本词収录歉据啦青单中的基本词:2-邱匚聞】收報遥项鮮帕类込3对银行翌营管浬、辰良京統研寂过程折挣及的責鬻項定4象抿项?&单主代码表的具体定文.5代玛裹值幅表中射瓶表隹的做。

2、&定酬嚼性就r相关的内容,用于瞬耕施1卿_沉_企业猫据宇蜒制宦:y企业字典主要内容包括业务术语中根词和类词,数据项和域值代码等,实际中数据字典包含如下:基本词:是组成数据对象中文名称的,具有一定程度独立完整的含义、最细的力度、正常惯 用的词汇,是对数据对象命名规范管理的基础,如:贷款、利息、损益、年、月、再、后等。 所有数据对象的中文名称均由基本词和类词组合而成。基本词包括核心基本词和扩展基本词。核心基本词主要用于实体名,业务属性(不包括 外部数据)和业务域名的翻译;扩展基本词主要用于代码取值中文,技术属性和技术域名, 外部属性和外部域名的翻译。 类词:类词,是“属性”名称的最后一个词语,反映

3、了属性所选的域组。它是基于人们的语言 习惯,在属性名称中,对属性取值类型的反映。属性的取值都有一定的规则、范围,这些规 则在数据模型中以“域”方式定义。同时在习惯的属性命名中,中文名称的最后一个词通常一 定程度上反应了属性的取值属性,为此我们将最后一个词单独出来,以“类词”的方式加以规 范管理。数据项(Data Item):由一组属性规定其定义、标识、表示和允许值的数据单元,包括分类 属性、基本属性、业务属性、技术属性和管理属性的定义。域组: 按照企业级数据标准制定的规范,数据模型中的属性值的集合共分为十个域组:文本 类、数值类、金额类、百分比类、日期类、时间类、日期时间类、指示器类、编码类、

4、代码 类。域: 是用于企业数据模型中的数据类型,数据格式的定义。域是数据模型中属性定义的一部 分,它定义了与“属性取值”相关的业务概念层次的内容。首先域会区分和控制属性的取值范 围,其次域会确定属性的数据格式和用途。域是属性值集合的通用表示,每个单独的属性都 有需要遵循的值的范围,因此域具有清晰的值的范围。域依据域组再进行细分,对于代码类, 一个代码会对应一个域。代码值表:代码值表是一组由数值、字符或符号以离散形式表示信息的明确的取值的 集合;是域组为代码类的域是枚举型的数据类型,枚举的集合名称为代码值表。代码表作 为代码类的域统一纳入域管理。如代码值为性别,代码值表是男、女。我所在的企业的数

5、据架构组,维护整个数据架构的企业级的数据字典,企业级的数据字典内容如下:且31X;制 EDAH -WT-”非W* :St底顷希单丨蕊娶馬11 f咖更司呃站亦Hl須-字从图中看出标准标准和数据模型,指标数据和技术类数据和元数据可以用为个 来数据字典的来源,很多人蒙了,数据字典不是和元数据差不多吗?通常认为数据字典 是元数据的一部分吗?为什么这里又说元数据又是数据字典的来源呢?我在前面的章 节中也提到过数据字典的内容是元数据的一部分,这里和前面的不是自相矛盾吗?这 是个大问题,这个问题也是很多做过数据治理和数据架构师说不明白的地方,先从元 数据和数据字典的定义出发,再来说明区别:元数据:定义和描述

6、其他数据的数据(国标GBT 18391)。也就是关于数据 的数据。包括描述业务领域相关概念、关系和规则的元数据,如企业级C模型、 业务术语、数据标准、业务指标等,以及描述技术领域相关概念、关系和规则的元 数据,如系统清单、数据字典、物理模型、数据映射、ETL日志等数据字典是对企业经营管理、信息系统研发过程中涉及数据项定义的收录和编 制,通过标准化处理数据项的描述信息进而提高整体的数据质量,为业务、技术人 员以及外部监管提供可靠数据服务奠定基础。利用数据模型与字典工具,可以快速 找到需要的数据,了解数据来源及转换、计算的业务规则,统一定义、管理业务规 则,快速准确的了解业务信息等;快速准确的了解

7、系统信息和数据库结构,了解数 据流程及依赖关系,评估数据库或应用变更的影响等从下者的定义不难看出,元数据包含数据字典的,因为元数据定义中有数据字典 啊,但是在数据字典中没有包含元数据啊?数据字典是80年代出现的,而元数据出现 90年代,就是说数据字典出现的更早,最开始是数据库对象的描述的集合,是结构的 数据描述,元数据出现的晚,是结构的描述,描述的对象不仅仅是结构化还有非结构.这里的元数据包含的数据字典其实是现状的应用系统的数据字典,不是企业级 的数据字典,什么意思呢,我们只看概念是不行的,元数据对现状的元数据和目标的元 数据,这里所说的元数据有现状和目标,就是说元数包含数据字典,是从元数据现

8、状建模角出发的,这没问题,也是上面所说的内容,而我上面所说的元数据是数据字典的来 源,是说我的企业级的数据字典是对目标来说的,这样的我的数据字典的输入是通常 是目标的元数据和目标的数据标准和目标的模型,这回大家明白了,这是我做项目中 实际做的,很多人不明白数据字典和元数据的区别,是因为实际中没有做过项目,只从 概念上来理解就会有误区.实际中企业级数据字典更多的管理如下对象,应该的数据字典通常被企业级字 典约束,特别是企业级的需求或是交换和共享的数据需求,至于无交换或共享的需求, 在应该字典中维护企业级数据字典词汇耳I佃晶育) - 基本词頁I分类咸性I类词目I基年慝世业霁慝性按术凤性T篙理風性数

9、据项、域、代表值关系如下图所示:数据项1.1/11基本词是组成数据对象中文名称的,具有一定程度独立完整的含义、最细的 力度、正常惯用的词汇,是对数据对象命名规范管理的基础,如:贷款、利息、损 益、年、月、再、后等。类词属于基本词,是组成中文名称的最后一个基本词,表 达了属性取值的属性。所有数据对象的中文名称均由基本词和类词组合而成。基本 词和类词不是数据架构管控对象。基本词、类词由数据组负责,并作为交付物提交 至平台。2技术词根是指技术数据的词根、前缀及全局技术数据,词根分为一级词根与 二级词根,词根、前缀及全局技术数据,由项目组申请,数据架构组统一审核。3数据项根据其特点及管理要求不同,分为

10、五大类业务基础数据、业务衍生数 据、业务派生数据、技术数据、外部数据。由项目组申请,并提交数据组、数据架 构组审核。4域是用于企业数据模型中的数据类型,数据格式的定义。域是数据模型中属 性定义的一部分,它定义了与“属性取值”相关的业务概念层次的内容。域由项目 组申请,并提交数据组、数据架构组审核。5代码表是一组由数值、字符或符号以离散形式表示信息的明确的取值的集 合,代码表作为代码类的域统一纳入域管理。代码表随代码类域一同提交申请。本节主要讲发企业的数据字典的分类和组成,讲了企业级数据字典和元数据的 区别,这点最为重要,这也是实际上大家不分不清的内容,最后讲了实际中企业级数据 字典和应用数据字典的区别,下节开始讲元数据,估计五章内容.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号