管理信息系统技术基础.ppt

上传人:工**** 文档编号:569506569 上传时间:2024-07-30 格式:PPT 页数:30 大小:267KB
返回 下载 相关 举报
管理信息系统技术基础.ppt_第1页
第1页 / 共30页
管理信息系统技术基础.ppt_第2页
第2页 / 共30页
管理信息系统技术基础.ppt_第3页
第3页 / 共30页
管理信息系统技术基础.ppt_第4页
第4页 / 共30页
管理信息系统技术基础.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《管理信息系统技术基础.ppt》由会员分享,可在线阅读,更多相关《管理信息系统技术基础.ppt(30页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章 管理信息系统技术基础管理信息系统技术基础 学习目标学习目标学习目标学习目标 1 1 1 1了解数据管理技术发展的三个阶段以及在数据库管理了解数据管理技术发展的三个阶段以及在数据库管理了解数据管理技术发展的三个阶段以及在数据库管理了解数据管理技术发展的三个阶段以及在数据库管理阶段数据库系统的组成。阶段数据库系统的组成。阶段数据库系统的组成。阶段数据库系统的组成。2 2 2 2理解数据库设计的各个阶段以及与此相关的数据模型、理解数据库设计的各个阶段以及与此相关的数据模型、理解数据库设计的各个阶段以及与此相关的数据模型、理解数据库设计的各个阶段以及与此相关的数据模型、数据库的三级模式结

2、构和关系规范化的知识。数据库的三级模式结构和关系规范化的知识。数据库的三级模式结构和关系规范化的知识。数据库的三级模式结构和关系规范化的知识。3 3 3 3理解数据仓库和数据挖掘的概念。理解数据仓库和数据挖掘的概念。理解数据仓库和数据挖掘的概念。理解数据仓库和数据挖掘的概念。4 4 4 4了解以数据仓库为基础,以联机分析和数据挖掘工具了解以数据仓库为基础,以联机分析和数据挖掘工具了解以数据仓库为基础,以联机分析和数据挖掘工具了解以数据仓库为基础,以联机分析和数据挖掘工具为主要手段的高级信息处理技术。为主要手段的高级信息处理技术。为主要手段的高级信息处理技术。为主要手段的高级信息处理技术。5 5

3、 5 5理解管理信息系统的基本物理结构及数据通信和计算理解管理信息系统的基本物理结构及数据通信和计算理解管理信息系统的基本物理结构及数据通信和计算理解管理信息系统的基本物理结构及数据通信和计算机网络的基础知识。机网络的基础知识。机网络的基础知识。机网络的基础知识。6 6 6 6学会学会学会学会Access 2003Access 2003Access 2003Access 2003数据库的操作。数据库的操作。数据库的操作。数据库的操作。 2.2 2.2 相关理论知识相关理论知识 2.2.1 数据管理技术发展1人工管理阶段 2文件系统阶段3数据库管理系统阶段2.2.2 数据模型1层次数据模型(1)

4、层次数据模型的定义。层次数据模型是指以层次或树形结构来表示实体之间的联系,层次模型只能描述数据之间一对一或一对多的关系。层次结构是树结构,树的结点是记录类型,非根结点有且只有一个父结点。上一层记录类型和下一层记录类型是一对多的关系。记录之间的联系通过指针来实现,查询效率较高,如图2-9所示。2.2 2.2 相关理论知识相关理论知识(2)层次数据模型的操纵与完整性约束。层次数据模型的操纵主要有查询、插入、删除和更新。进行插入、删除、更新操作时要满足层次模型的完整性约束条件。2.2 2.2 相关理论知识相关理论知识2网状数据模型(1)网状数据模型的定义。网状数据模型是指数据与数据之间的关系呈多对多

5、的关系,如图2-10所示。2.2 2.2 相关理论知识相关理论知识(2)网状数据模型的操纵与完整性约束。 一个记录不能兼任同一个系的首记录和属记录。 一个记录不能同时出现在同一系型的多个系值中。 在插入一个记录时,如果该记录将要作为某个系的属记录,要考虑以何种方式加入到系值中,也就是考虑其系籍问题。网状数据模型提供了两种插入记录的系籍约束。(a)AUTOMATIC(自动的)方式:新插入记录自动加入相应的系值。例如,对于“班级学生”系,可以遵守AUTOMATIC约束,每录入一个学生的记录,自动加入一个班级。(b)MANUAL(人工的)方式:新插入记录不自动加入相应的系值,若要加入某个系值,须用C

6、ONNECT命令完成。例如,对于“运动队学生”系,可以遵守MANUAL约束,学生入校时,不一定要加入运动队。 对已插入的属记录的系籍处理,提供了三种约束。(a)随意性约束:允许记录从一系转到另一系,也可以脱离某个系而独立存在。(b)强制性约束:允许记录转系,但任何时候都必须属于某个系值,不允许脱离系值独立存在。(c)固定性约束:属记录只能属于一个系值,不能存在于该系值之外。 删除首记录时,要考虑记录的系籍约束。(a)记录是随意性约束时,可以删除首记录。(b)记录是强制性约束时,首记录不能删除。(c)记录是固定性约束时,首、属记录一同删掉。 2.2 2.2 相关理论知识相关理论知识3关系数据模型

7、(1)关系数据模型的定义。关系数据模型是用二维表来表达实体与实体之间联系的数据模型。在用户看来,一个关系模型的逻辑结构是一张二维表,它由行和列组成,如图2-11所示。2.2 2.2 相关理论知识相关理论知识 关系。一个二维表就表示一个关系,由关系名标识它,记为:关系名(字段1,字段2,字段,n)图2-11所示的表的关系记为:职工工资表(职工号,姓名,职称,部门,基本工资,工龄,职务,水电,房租) 记录。表中的一行即为一个记录。 字段。表中的一列即为一个字段,由列名来标识;字段在每个相应的记录上都有一个投影值,该值称为该字段在该记录的分量。例如,职工工资表中有9个字段,每个字段是组成数据的最小单

8、位,其中字段名“职称”、“工程师”和“经济师”都是组成“职称”数据的最小单位。 字段值是可以唯一确定一个记录的最小值。 实体是指客观存在并相互区别的事物。例如,一名教师、一名学生、学生的一次选课和一次借书等。 关键字是唯一标识实体的字段集,如“职工号”是唯一标识实体的字段,所以,“职工号”是职工工资表中的关键字。 行和列的位置是可以互换的,不同列的字段名是不可重复的,同一表中不允许有完全相同的两行,在表中每一字段项都必须不可再分。关系模型以严密的数学理论为基础,把数据及其联系看成二维表结构,每个关系形成一个二维表,每个二维表构成一个数据库。 2.2 2.2 相关理论知识相关理论知识2.2.3

9、数据仓库1数据仓库概述人们对数据仓库最大的误解就是把它当作一个现成的可以直接买来使用的产品。数据仓库和数据库不同,它不是现成的软件或者硬件产品。确切地说,数据仓库是一种解决方案,是一种思想,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而做出策略性的决策。2.2 2.2 相关理论知识相关理论知识数据仓库是一个环境,而不是一件产品,主要提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效地把操作型数据集成到统一的环境中,以提供决策型数据访问的各种技术和模块的总称。它所做的一切都是为了让用户更快、更方便地查

10、询所需要的信息,提供决策支持。2数据仓库的特征(1)面向主题的数据集合(2)集成的数据集合(3)时变的数据集合(4)非易失的数据集合2.2 2.2 相关理论知识相关理论知识3数据仓库的类型(1)企业数据仓库(EDW)。企业数据仓库为通用数据仓库,它既含有大量详细的数据,也含有大量累赘的或聚集的数据,这些数据具有不易改变性和面向历史性。这种数据仓库被用来进行涵盖多种企业领域的战略或战术上的决策。(2)操作型数据仓库(ODS)。操作型数据仓库既可以被用来针对工作数据进行决策支持,又可用做将数据加载到数据仓库时的过渡区域。与EDW相比较,ODS具有以下特点。 ODS是面向主题和面向综合的; ODS是

11、易变的; ODS仅仅含有目前的、详细的数据,不含有累计的、历史性的数据。(3)数据集市(DataMart)。数据集市是数据仓库的一种具体化,它可以包含轻度累计的、历史性的部门数据,适合特定企业中某个部门的需要。 2.2 2.2 相关理论知识相关理论知识5建立数据仓库的主要步骤(1)系统主题的确定(2)数据库的逻辑设计(3)数据库的物理设计(4)源数据的获取、清洗、整理及装载设计(5)数据表达及访问设计(6)不间断的维护方案的设计(7)编码、测试及实施 2.3 2.3 相关实践知识相关实践知识 2.3.1 数据挖掘技术的由来1数据爆炸但知识贫乏2支持数据挖掘技术的基础3商业数据的进程2.3 2.

12、3 相关实践知识相关实践知识2.3.2 数据挖掘定义1从技术角度的定义数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅要求能支持特定的发现问题。 2.3 2.3 相关实践知识相关实践知识2从商业角度的定义数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据

13、。数据挖掘可以描述为:按企业的既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。 2.3 2.3 相关实践知识相关实践知识3数据挖掘和数据仓库 数据挖掘库可能是数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。但如果数据仓库的计算资源已经很紧张,那么最好还是建立一个单独的数据挖掘库。当然为了数据挖掘也不必非得建立一个数据仓库,数据仓库不是必需的。建立一个巨大的数据仓库,把各个不同源的数据统一到一起,解决所有的数据冲突问题,然后把所有的数据导入到一个数据仓库内,是一项巨大的工程,可能要用几年的时间花上百万的钱才能完

14、成。如果只是为了数据挖掘,可以把一个或几个事务数据库导入到一个只读的数据库中,把它当做数据集市,然后对它进行数据挖掘,如图2-15所示。 2.3 2.3 相关实践知识相关实践知识数据挖掘利用了人工智能(AI)和统计分析的进步所带来的好处,这两门学科都致力于模式发现和预测。数据挖掘不是为了替代传统的统计分析技术,相反,它是统计分析方法学的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,但对使用者的要求很高。而随着计算机计算能力的不断增强,人们有可能利用计算机强大的计算能力而只通过相对简单和固定的方法完成同样的功能。 2.3 2.3 相关实践知识相关实践知识2.3.3 数据挖掘应

15、用1数据挖掘解决的典型商业问题目前,在很多领域中,数据挖掘都是一个很时髦的词,尤其是在银行、电信、保险、交通、零售(如超级市场)等商业领域。数据挖掘所能解决的典型商业问题包括数据库营销(Database Marketing)、客 户 群 体 划 分 ( Customer Segmentation & Classification) 、 背 景 分 析 ( Profile Analysis)、交叉销售(Cross-selling)等市场分析行为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等。 2数

16、据挖掘在市场营销中的应用2.4 2.4 职业技能训练职业技能训练 2.4.1 理解数据库系统1数据库应用系统 数据库应用系统是指系统开发人员利用数据库系统资源开发出来的,面向某一类实际应用的应用软件系统。例如,人力资源管理信息系统、财务管理信息系统、人事管理信息系统、学生学籍管理信息系统等等。2数据库管理系统数据库管理系统是位于用户与操作系统之间的数据管理软件,其基本功能包括以下几个方面。 数据定义功能。用户可以通过数据定义语言对数据库中的数据对象进行定义。 数据操作功能。用户可以使用数据操纵语言操纵数据,如查询、插入、删除和修改。 数据库运行管理功能。数据库在建立、运行和维护时由数据库管理系

17、统统一管理和控制。图2-16 数据库系统的组成 数据库的建立和维护功能。包括数据库初始数据的输入、转换功能,以及数据库的转储、恢复功能等。2.4 2.4 职业技能训练职业技能训练3数据库系统的组成 4数据库系统的结构 2.4.2 关系数据库设计 1数据库设计方法(1)手工试凑法。 (2)规范设计法 2.4 2.4 职业技能训练职业技能训练2数据库设计规范(1)规范化的概念。规范化是数据库设计中的一个重要过程,可以通过它来剔除数据库中冗余的数据。1971年E.F.Codd博士首先提出了关系数据库的规范化理论,之后,此理论被不断深化、完善。 (2)规范化的优点。 大大减少了数据冗余; 改进了数据库

18、的整体组织; 增强了数据的一致性; 增加了数据库设计的灵活性 2.4 2.4 职业技能训练职业技能训练(3)范式设计中的几个术语。 Y函数依赖于X记作:XY;Y完全函数依赖于X记作:; Y部分函数依赖于X记作:;Z传递函数依赖于X记作:; 关系R具有连接依赖记作:JD*(X1,X2,Xn)(JD即Join Dependency);Y多值依赖于X记作:XY。 第一范式记作1NF;第二范式记作2NF;第三范式记作3NF;第四范式记作4NF;第五范式记作5NF。(4)第一范式。定义:如果关系R 中所有字段的值域都是单纯域,那么关系模式R是第一范式的,记作R1NF。这一限制是关系的基本性质,所以任何关

19、系都必须满足第一范式。在仅满足1NF的表中,数据冗余大,修改量大,插入、删除时会有异常,由此我们引入2NF。第一范式规定表中每个列的值都是不可分的简单数据项。在任何一个数据库中,第一范式都是最基本的要求。例如,图2-18中的第一张表是不符合第一范式的表,第二张表是修改后符合第一范式的表。2.4 2.4 职业技能训练职业技能训练2.4 2.4 职业技能训练职业技能训练(5)第二范式。定义:如果关系模式R属于第一范式,而且关系中每一个非主属性都完全依赖于主键,则称R是第二范式的,记作R2NF。不满足2NF的关系会产生插入异常、删除异常、修改复杂等问题,解决的办法是用投影分解。第二范式有以下两项要求

20、。 所有表必须符合第一范式。 表中每一个非主键列都必须完全函数依赖于主键(关键字)。例如,图2-19所示的表就不符合第二范式。 2.4 2.4 职业技能训练职业技能训练表的不完全函数依赖关系将导致很多问题发生。 数据冗余:如果外语系有700个学生,就得重复输入700次相同的系名。 更新异常:如果“外语系”升级成了“外语学院”,那么所有原外语系学生的元组都要更新,很难保证修改不出错误。 插入异常:如果增加了一个新系,但该系还没有学生,那么这个系将不能加入数据库。 2.4 2.4 职业技能训练职业技能训练(6)第三范式。定义:如果关系模式R属于第二范式,且每一个非主属性都不传递依赖于主键,则称R是

21、第三范式的,记作R3NF。第三范式有以下两项要求。 所有表必须符合第二范式。 表中每一个非主键列对主键都不存在传递依赖,而应是直接依赖。例如,图2-20所示的表就不符合第三范式。 2.4 2.4 职业技能训练职业技能训练传递依赖的存在与违背第二范式一样,也会导致添加、删除、更新、冗余等问题。表中出现这些问题的原因是对主键依赖的传递。解决的方法同样是在遵守无损分解的条件下,将表分解成多个表,从而消除传递依赖的情况。2.4 2.4 职业技能训练职业技能训练(7)第四范式。定义:关系模式R(U,F)1NF,X、Y是的非空子集,Z=U-X-Y也非空。此时若XY,X必包含R的主键,则称R是第四范式的,记

22、作R4NF。第四范式禁止了主键列和非主键列之间的一对多关系,例如,图2-21所示的表就不符合第四范式。 2.4 2.4 职业技能训练职业技能训练在表中,一个学生可以有多种喜欢的运动,也可以有多类喜欢的图书,这样在同一表中就有这样两个不相关的列与主键存在多对一的关系,使得表中存在冗余现象和不对称情况。因为不知道每个人的喜好情况,也就无法知道哪列的值多,哪列的值少,使表中出现了很多不规则的空白。解决的方法同样是在遵守无损分解的条件下,将表分解成多个表,从而消除传递依赖的情况。 2.4 2.4 职业技能训练职业技能训练2.4.3 关系数据库操作本小节以Access 2003数据库为例,介绍其一般的操作方法。1创建数据库2打开数据库3创建表的方式4字段名的数据类型 本次课程结束,谢谢合作!本次课程结束,谢谢合作!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号