基于卫生行业信息系统的数据仓库和数据挖掘设计

上传人:小** 文档编号:89507185 上传时间:2019-05-26 格式:DOCX 页数:89 大小:981.25KB
返回 下载 相关 举报
基于卫生行业信息系统的数据仓库和数据挖掘设计_第1页
第1页 / 共89页
基于卫生行业信息系统的数据仓库和数据挖掘设计_第2页
第2页 / 共89页
基于卫生行业信息系统的数据仓库和数据挖掘设计_第3页
第3页 / 共89页
基于卫生行业信息系统的数据仓库和数据挖掘设计_第4页
第4页 / 共89页
基于卫生行业信息系统的数据仓库和数据挖掘设计_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《基于卫生行业信息系统的数据仓库和数据挖掘设计》由会员分享,可在线阅读,更多相关《基于卫生行业信息系统的数据仓库和数据挖掘设计(89页珍藏版)》请在金锄头文库上搜索。

1、上海交通大学硕士学位论文基于卫生行业信息系统的数据仓库和数据挖掘设计姓名:石景明申请学位级别:硕士专业:软件工程指导教师:王英林;周浩20061201上海交通大学工程硕士研究生学位论文上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:石景明日期: 2007年 2月 9日- 91 -上海交通大学工程硕士研究生学位论文上海交通大

2、学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密,在本学位论文属于不保密。(请在以上方框内打“”)学位论文作者签名:石景明日期: 2007 年 2 月 9 日年解密后适用本授权书。指导教师签名:王英林日期:2007 年 2 月 9 日- 92 -上海交通大学工程硕士研究生学位论文摘要国内卫生行业信息化经过 10 多年的发展,已经在卫生行业里很多业务

3、部门得到了广泛的应用,但目前各类业务系统都还是基于关系型数据库以日常业务操作为主的 OLTP 系统阶段,还没有发展到基于数据仓库以数据分析为主的OLAP/DSS 系统阶段,通过计算机采集的各种业务数据,如果不能有效的挖掘,是得不到有价值的信息的!因此本课题的研究是从满足行业需求为目的,充分从数据中挖掘出信息的利用价值,从而更好的为卫生行业服务!本文的研究内容是实现对医疗卫生信息的数据挖掘分析研究,选择了一个实际的卫生资源数据库为研究对象,完整的实现了从构建数据仓库到数据分析挖掘、再到数据展现的各个阶段,主要内容包括构建专题数据仓库、数据仓库的ETL 和应用一些数据挖掘算法对医疗卫生信息进行的数

4、据挖掘分析研究。在设计构建数据仓库方面,涵盖了概念模型设计、逻辑模型设计、物理模型设计和数据仓库生成的整个过程;ETL 设计开发则创新性的在标准的元数据模型CWM 基础上,设计开发了基于 XML 数据交换技术的标准 ETL 工具。在数据分析挖掘方面,主要根据卫生信息应用的需求重点研究了基于关联规则的分析挖掘、基于聚类分析的数据挖掘算法等相关技术在医疗卫生信息数据上挖掘应用,获得了对卫生管理尤其疾病控制很有意义的研究成果。在数据展现方面,重点介绍了数据分析结果的前台展现,主要是应用了一些好的前台展现工具实现。本文的意义在于,本文通过 ETL 技术不仅成功的整合了以前分散的各类卫生信息资源,形成了

5、初具规模的卫生信息数据仓库,并且应用了一些数据挖掘算法实现了对医疗卫生信息数据的分析挖掘,这些方法对于卫生管理和疾病控制、提高社区居民医疗卫生保健水平有一定的参考和指导意义。关键词:医疗卫生信息,数据仓库,ETL,数据挖掘-3-上海交通大学工程硕士研究生学位论文AbstractInformatization course of homeland hygiene industry developed more than 10years, and now has already got broad application in many business branches withinhygien

6、e industry. But at present lots of business systems are still in OLTP systemstage which mainly concludes daily business operations and based on relational-typedata base, and still do not run to OLAP/DSS system stage which mainly concludesdata analysis and based on data warehouse. The information col

7、lected by computercant be valuable unless be mined efficiently. Therefore the paper satisfies industryneed, and sufficiently mines value of information, so as to serve hygiene industrybetter.The research of this paper realizes medical health information data mininganalysis, and has chosen an actual

8、hygienic resources database as the research object.The paper completely realizes all stages from data warehouse constructing, datamining, to data presentation. The main content of which concludes special datawarehouse constructing, ETL of data warehouse and applying data-mining algorithmsto the medi

9、cal health information. Constructing data warehouse covers entireprocess including the conceptual model design, logical model design, physical modeldesign and data warehouse building. ETL based on the standard Meta data modelCWM, designed and developed standard ETL tools based on XML data exchangete

10、chnology.Mainly considers requirement emphasis of hygienic information application, thepaper mainly studied data analysis and data mining which are based on the relationrule, data mining algorithms which based on gathered kind of analysis and so on, andobtained significant research results on hygien

11、ic management especially on diseasecontrol.The paper also introduced data presentation of the data analysis results, andmainly utilizes some efficient tools to realize it.The papers significance lies in that the project based on ETL technology so notonly successfully integrated distributed informati

12、on into hygienic information datawarehouse which began to take shape, but also applied some data mining algorithmsto realize the medical health information data analysis and mining, and these methodscan be a reference or instruction to health management, disease control and societyresidents health i

13、mprovement.Keywords: Medical health information,Data warehourse,ETL,Data mining-4-上海交通大学工程硕士研究生学位论文第 1 章概述1.1 应用背景和问题的提出计算机信息管理系统在医疗卫生机构的广泛应用,促进了医学信息的数字化,同时,电子病历和病案的大量应用、医疗设备和仪器的数字化,使得医疗卫生数据库的信息容量不断地膨胀。这些宝贵的医学信息资源对于疾病的诊断、治疗和医学研究都是非常有价值的。然而,目前大多数医疗卫生机构对数据库的处理仅限数据的录入、修改、查询、删除等平凡过程,属于医疗卫生数据库的低端操作,缺乏数据的

14、集成和分析,更谈不上医学决策和知识的自动获取。如何利用这些海量的信息资源来为疾病的预防、诊断和治疗提供科学的决策,总结各种医治方案的疗效,更好地为医疗卫生机构的决策管理、医疗、疾病控制、卫生管理、科研和教学服务,已越来越为人们关注。另一方面,随着人们生活水平的提高、保健意识的增强以及我国医疗体制改革的深入,基于计算机技术、通信技术的远程医疗和社区医疗,已经逐渐成为各大医院的另一个潜在市场。如何对医疗卫生数据库进行自动提升和处理,使其更好地为远程医疗和社区医疗提供全面的、准确的诊断决策和保健措施,已成为促进医疗卫生事业发展、提高服务质量而必须解决的新问题。正是在这种背景下、医学数据挖掘应运而生。1.2 研究内容的介绍本课题研究的信息资源主要基于上海市嘉定区卫生信息数据库,该数据库始

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号