基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文

上传人:wo7****35 文档编号:55274086 上传时间:2018-09-26 格式:DOC 页数:54 大小:2.01MB
返回 下载 相关 举报
基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文_第1页
第1页 / 共54页
基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文_第2页
第2页 / 共54页
基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文_第3页
第3页 / 共54页
基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文_第4页
第4页 / 共54页
基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文_第5页
第5页 / 共54页
亲,该文档总共54页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文》由会员分享,可在线阅读,更多相关《基于临床数据的数据挖掘软件开发——分类分析模块及关联规则模块设计---毕业论文(54页珍藏版)》请在金锄头文库上搜索。

1、本本 科科 毕毕 业业 论论 文文基于临床数据的数据挖掘软件开发基于临床数据的数据挖掘软件开发 分类分析模块及关联规则模块设计分类分析模块及关联规则模块设计The Software Development of Clinical Data MiningThe Design of Classification Analysis Module and Association Module姓 名: 学 号:学 院:软件学院系:软件工程专 业:软件工程年 级:校内指导教师: 助理教授年年 月月摘要I摘要摘要近十几年,随着科学技术飞速的发展,经济和社会都取得了极大的进步,与此同时,在各个领域产生了大量的

2、数据,人们累积的数据也越来越多,如人类对太空的探索,银行每天的巨额交易数据。 激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据,在数据仓库里面,通过研究数据之间看似毫无关系的信息,发现隐藏的规律。计算机技术的迅速发展使得快速处理数据成为可能,这就推动了数据库技术的极大发展。但是目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。使用数据挖掘工具进行数据分析,可以发现重要的数据模式,对商务策略、知识库、

3、科学和医学研究做出巨大贡献,将数据坟墓转换成知识“金块” 。本软件设计开发的目的就是希望能够从一堆数据中挖掘出有价值的“金块” 。本软件的设计就是基于上述原因,完成一个针对癌症病理医学的数据分析挖掘软件,包括后台功能的实现和前台管理软件界面的设计。调用 weka.jar 包里面的类方法,实现了数据预处理、关联规则、分类、聚类等四个模块的功能。并将数据以散点图、柱状图、折线图、饼图等可视化方法显示,以进行可视化的分析。关键字:关键字:医学数据;数据挖掘;weka. 摘要IIAbstractIIIAbstractIn recent years, along with the rapid devel

4、opment of science and technology, economy and society has made great progress. As various fields produce a large number of data, we accumulated more and more data, such as human space exploration, the major trading data bank everyday. And it is desired to obtain the higher level analysis, in order t

5、o better use the knowledge deep inside the data warehouse and data through the study of the relationship between different information, finding hidden rules. With the rapid development of computer technology, data can be made with the database technology greatly promoted the development. The current

6、 database system can effectively achieve data entry, inquiry, statistics, and so on the function, but couldnt find the relationship of data and rules, can according to the existing data to predict the future trend of development. Lacking of knowledge of data mining behind the means, causing the expl

7、osion but little knowledge “data“ phenomenon. The data mining techniques can discover the importance of data model, business strategies, and knowledge base, scientific and medical research made great contribution to the grave, which will convert knowledge “data“ to gold. The design of the software d

8、evelopment goal is hoping to a pile of data mining of value “gold“.This software is designed based on the above reasons. It is a medical data mining software for the cancer pathological analysis, including backstage function realization and the software design based on the management which is called

9、 “weka”. The methods of bag jar realizes data pretreatment, the association rules, classification, clustering of four modules. And the data for a dot chart, histogram, line charts and pie charts, etc, can also be displayed with the visualization methods visual analysis.Key words: clinical data, data

10、 mining, weka目录IV目录目录第一章第一章 绪论绪论.11.11.1 引言引言 1 11.1.1 起源11.1.2 什么是数据挖掘11.1.3 课题背景21.1.4 课题研究意义31.1.5 目标31.21.2 论文组织结构论文组织结构 4 4第二章第二章 模块及功能介绍模块及功能介绍.62.1WEKA2.1WEKA 简介简介 6 62.2Eagle-I2.2Eagle-I 简介简介 6 62.32.3 开发环境开发环境 6 62.42.4 技术及原理介绍技术及原理介绍 7 72.4.1 分类器原理72.4.2 分类72.4.3 分类器算法72.4.4 测试集选项82.4.5 关联

11、规则原理92.4.6 多表关联规则9第三章第三章 概要设计概要设计.113.13.1 编写目的编写目的 11113.23.2 总体设计总体设计 11113.2.1 整体结构设计.113.2.2 模块设计.123.33.3 接口设计接口设计 13133.3.1 内部接口133.3.2 外部接口153.43.4 运行设计运行设计 15153.4.1 运行模块组合15目录V3.4.2 运行控制153.53.5 系统出错处理设计系统出错处理设计 16163.5.1 出错信息提示163.5.2 补救措施.16第四章第四章 详细设计及实现详细设计及实现.174.14.1 编写目的编写目的 17174.24

12、.2 软件结构软件结构17174.2.1 软件架构174.2.2 系统包图174.2.3 系统类图194.34.3 界面设计界面设计 23234.44.4 流程设计流程设计 24244.4.1 系统流程244.4.2 模块流程254.54.5 模块设计与实现模块设计与实现26264.5.1 关联规则264.5.2 分类器32第五章第五章 测试结果及分析测试结果及分析.425.15.1 系统测试系统测试 42425.25.2 集成测试集成测试 4242第六章第六章 总结与展望总结与展望.446.16.1 论文总结论文总结 44446.26.2 使用工具使用工具 44446.36.3 项目展望项目

13、展望 4545参考文献参考文献.46致致 谢谢.47ContentVIContentContentChart 1 Preface.11.1 Introduction 11.1 Introduction 11.1.1 Origin.11.1.2 What is data mining.11.1.3 Background21.1.4 Research significance31.1.5 Goal.4Chart 2 Introduction function module62.1WEKA Introduction62.2Eagle-I Introduction62.3Development env

14、ironment62.4Technology and principle introduction.72.4.1Classifier principle72.4.2Classifier.72.4.3Classiffier function.72.4.4Test set82.4.5Association principle92.4.6Multi-table association .9Chart 3Outlinedesign113.1Purpose.113.2Overall design 113.2.1 Whole Structure design .113.2.2 Module design.

15、123.3Interface design133.3.1Internal interface.133.3.2External interface153.4Operation design153.4.1Operation modules153.4.2Operational control.153.5System error processing design16ContentVII3.5.1Wrong information clew.163.5.2 Remedial measures16Chart 4Detaile design and realization174.1Purpose.174.

16、2 Software structure174.2.1Software architecture174.2.2System packages.174.2.3System classes194.3UI design.234.4Process design 244.4.1System process .244.4.2Module process.254.5 Module design and realization 264.5.1Association.264.5.2Classifier.32Chart 5 Test results and analysis.425.1System test425.2Integration testing .42Chart 6 Summarize and prospect446.1Paper summarize.446.2Use tools446.3Project outlook.45References 46Thank

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号