[数据元标准化基础方法]数据标准化方法

上传人:s9****2 文档编号:486138063 上传时间:2023-04-13 格式:DOCX 页数:5 大小:17.22KB
返回 下载 相关 举报
[数据元标准化基础方法]数据标准化方法_第1页
第1页 / 共5页
[数据元标准化基础方法]数据标准化方法_第2页
第2页 / 共5页
[数据元标准化基础方法]数据标准化方法_第3页
第3页 / 共5页
[数据元标准化基础方法]数据标准化方法_第4页
第4页 / 共5页
[数据元标准化基础方法]数据标准化方法_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《[数据元标准化基础方法]数据标准化方法》由会员分享,可在线阅读,更多相关《[数据元标准化基础方法]数据标准化方法(5页珍藏版)》请在金锄头文库上搜索。

1、数据元标准化基础方法数据标准化方法 公共卫生数据元的标准化,不但要对数据本身进行“名、型、值”的定义,还要找出数据之间内在和外在间的关联关系,对构建高效稳健的公共卫生数据模型起到主动的作用。 数据标准化工作是信息系统建设的基础工作。数据工作的无规则性,必定会造成系统的低效能和资源的浪费。长久以来,中国公共卫生信息系统的建设缺乏整体计划,在国家层面上缺乏对公共卫生数据的标准定义和规范,造成了不一样系统之间的数据难以交换、共享,也造成了资源的极大浪费。公共卫生数据元的标准化,不但要对数据本身进行“名、型、值”的定义,还要找出数据之间内在和外在间的关联关系,对构建高效稳健的公共卫生数据模型起到主动的

2、作用。数据元基础概念和结构数据元可定义为经过标识、定义、表示和许可值等一系列属性描述的数据单元,在特定的语义环境中被认为是不可再分的最小数据单元,通常由对象类词、特征类词和表示三部分组成。对象类词: 是指大家期望研究、搜集和存放其相关数据的事物,如: 人、家庭、医疗机构、观察和干预等。特征类词: 是某个对象的一个特征。比如,人这个对象类能够含有很多特征,如性别、出生日期、身高、职业或患病情况等。表示是值域、数据类型的组合,必须时也包含度量单位或字符集。它所表示的是数据元概念的数据类型及可能的取值范围。表示类词能够是一个编码,如国际疾病分类,也可能是一个取值范围,如身高的取值。对象往往有多个特征

3、,对象和其任何一个有意义的特征的结合就组成一个数据元概念。比如,人这个“对象”能够有性别、身高、出生日期等多个“特征”,将它和其中的某一个特征结合在一起就组成一个“数据元概念”,如人性别、人身高和人出生日期等全部是数据元概念的例子。数据元是数据元概念和值域的结合。即一个特定的数据元概念和一个特定的值域结合创立一个数据元。比如在儿童营养监测中,定义的一个数据元概念“儿童身高”,和身高的表示值域结合,组成数据元“儿童身高的测量值”; 而和儿童身高的平均水平值域结合,则组成“儿童身高的平均值”这个数据元。显然,这是两个不一样的数据元。数据元概念和数据元之间存在一对多的关系,即一个数据元概念和不一样的

4、表示组合后能够生成不一样的数据元。数据元标准化的主要作用规范和统一数据的采集和应用; 构筑数据共享的基础,为不一样系统多个模式的数据存取和数据共享提供数据转换格式和编程接口; 实现对公共卫生数据在“元数据”层面上的管理,从而使“应用软件”真正和“数据”分家,使应用软件的开发更具灵活性; 为公共卫生内部数据交换及公共卫生和外部数据交换在“数据”这一层上提供统一的、各学科能够共同遵守的数据交换规范; 是构建统一、集成、高效的公共卫生数据模型的基础。数据元标准化方法1.数据元的提取公共卫生数据元的提取采取以下步骤: 业务需求分析。包含步骤分析,业务建模。基础数据集设置。将必须搜集的数据根据特征分成不

5、一样数据集,确定每个数据集中的数据项; 数据元构建。对抽取的数据项,按对象类词、特征类词及表示类词构建数据元。2.数据元的规范化描述数据元的规范化描述是指根据国际或国家标准对于所提取的数据元的属性进行描述。国家公共卫生数据元的属性的规范化描述遵照的标准为ISO/IEC 11179-3:2021和国家标准GB/T ,基础属性的模型图所表示。该标准要求对数据元的22个属性进行描述。内容包含标识类属性、定义类属性、关系类属性、表示类属性、管理类属性及附加类属性。数据元其中还说明了属性的出现次数和可选属性之间的绑定关系。结合实际,在公共卫生数据元的规范化的描述中,增加了英文名称及英文简称两个新的属性。

6、以“伤害发生原因”数据元规范化描述为例说明以下。标识类属性标识符: PH0802021名称: 伤害发生原因版本号:英文名称: cause of injury英文简称: cause of injury同义名称:注册机构: 标准化研究总体组相关环境:该数据元用以搜集伤害发生的原因。该数据元用于伤害监测数据集。定义类属性定义:填写造成伤害的起始原因,即在伤害发生链中最前面的原因。表示类属性表示类别: 代码法表示形式: 代码数据元值的数据类型: CV数据元值的最大长度: 2数据元值的最小长度: 1表示格式: n数据元许可值: 伤害原因代码表管理类属性主管机构: 中国疾病预防控制中心注册状态: 已登录提

7、交机构: 中国疾控中心慢病中心备注:数据元著录工具为了便于对数据元进行著录于管理而编制的公共卫生数据元著录和管理系统是参考中国国家质量监督检验检疫总局公布的数据元的规范和标准化国家标准进行设计开发的,其关键功效包含数据元著录、管理、查询和调用等。目标是以软件工具作为辅助手段建立一套符合数据元标准化的工作程序,确保用户在可操作性比较强的方法下,以标准化的方法进行数据元的著录和管理。系统设计为带有用户端软件的WEB服务模式,用户经过INTERNET或局域网络下载本系统的用户端软件,然后经过用户端界面和网络连接进行录入和管理功效,权限等级不一样的用户可进行操作的范围不一样。系统含有以下关键功效:1数据元著录功效: 数据元著录分为三个关键步骤:术语条目库建立、数据元生成和数据元属性著录。在详细操作中,用户可直接进入数据元生成步骤进行操作,也能够在有完整数据元的情况下直接进行数据元属性著录。2数据元查询功效: 能够选择针对数据元、数据元概念、对象类词术语、特征术语、表示术语来进行准确或模糊查询,和多个查询条件组合的查询。3数据元审核和注册功效。4数据元目录维护功效。5数据元字典维护功效。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号