《第10章 数据库新进展》由会员分享,可在线阅读,更多相关《第10章 数据库新进展(53页珍藏版)》请在金锄头文库上搜索。
1、电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 第十章第十章 数据库新进展数据库新进展10.1数据库技术的研究与发展数据库技术的研究与发展10.2数据仓库与数据挖掘数据仓库与数据挖掘 10.3XML数据管理数据管理 领域知识拓展领域知识拓展 侠仑馋恶轴槐茄哑缮讫鲁午过繁啥娠押疥渗嫂蕉俏歪尤敢乳嘻琴其建烃镐第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.1数据库技术的研究与发展数据库技术的研究与发展从从20世纪世纪80年代起,数据库技术在商业领域取得了巨大年代起,数据库技术在商业领域取得了巨大的
2、成功,刺激了其他领域对数据库技术需求的迅速增长。的成功,刺激了其他领域对数据库技术需求的迅速增长。一方面,新的数据库应用领域,如工程数据库、时态数一方面,新的数据库应用领域,如工程数据库、时态数据库、统计数据库、科学数据库、空间数据库等,为数据库、统计数据库、科学数据库、空间数据库等,为数据库应用开辟了新天地。据库应用开辟了新天地。另一方面,计算机技术的发展也不断地与数据库技术相另一方面,计算机技术的发展也不断地与数据库技术相结合,新的数据库系统不断诞生,如分布式数据库、多结合,新的数据库系统不断诞生,如分布式数据库、多媒体数据库、模糊数据库、并行数据库等。媒体数据库、模糊数据库、并行数据库等
3、。 彼娇鼎武形傻燃罢搓肢审豺绥给窃柯绑良秸寒昔只铰赘屉著鲍潮课汕扬蹈第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.1.1 数据库技术的发展 (1)20世纪世纪60年代后期,人们主要利用文件系统来生成各种年代后期,人们主要利用文件系统来生成各种报告。大量的文件使得维护和开发的复杂性提高,数据同报告。大量的文件使得维护和开发的复杂性提高,数据同步困难,对数据库技术的研究要求迫切。在科研人员的努步困难,对数据库技术的研究要求迫切。在科研人员的努力下推出了第一代数据库系统,即层次数据库和网状数据力下推出了第一代数据库系统,即
4、层次数据库和网状数据库。库。(2)20世纪世纪70年代,关系数据库之父年代,关系数据库之父E.F.Codd提出了关系数提出了关系数据模型。此后,关系数据库技术日趋成熟,并开始商业应据模型。此后,关系数据库技术日趋成熟,并开始商业应用。用。70年代后期,高性能的联机事务处理(年代后期,高性能的联机事务处理(On-LineTransactionProcessing,OLTP)开始应用。)开始应用。 椿稿忆冈蓬芥躁爬晰鸽鞘锦瞎择燥鉴豌鼎岛俐侨莱温嘿旨属攘诉志召忻舍第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 数据库技术的发展(3
5、)20世纪世纪80年代,随着数据库技术的成熟,联机事务处理年代,随着数据库技术的成熟,联机事务处理OLTP、管理信息系统(、管理信息系统(ManagementInformationSystem,MIS)和决策支持系统()和决策支持系统(DecisionSupportSystem,DSS)不断发展,对数据集成和数据分析要求越来越高,逐)不断发展,对数据集成和数据分析要求越来越高,逐步提出了步提出了“数据仓库数据仓库”(DataWarehouse)思想。代表是)思想。代表是IBM的的“InformationWarehouse”。(4)20世纪世纪90年代,数据库应用领域不断拓展,新概念和新年代,数
6、据库应用领域不断拓展,新概念和新技术不断涌现,有面向对象数据库、分布式数据库、并行技术不断涌现,有面向对象数据库、分布式数据库、并行数据库、主动数据库、知识库、模糊数据库、工程数据库数据库、主动数据库、知识库、模糊数据库、工程数据库等。数据仓库成为研究热点,有力地推动了相关研究的进等。数据仓库成为研究热点,有力地推动了相关研究的进展,如联机分析处理(展,如联机分析处理(On-LineAnalyticalProcessing,OLAP)、数据挖掘()、数据挖掘(DataMining,DM)和联机分析挖掘)和联机分析挖掘(On-LineAnalyticalMining,OLAM)。)。 沾胶凳且浙
7、驳唾许震萤酉羌选畅矢搪巨镜经侍述睁块命喷旦谋郎圈垃拘亦第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 数据库技术的发展(5)进入)进入21世纪后,数据仓库与数据挖掘研究领域世纪后,数据仓库与数据挖掘研究领域发展迅速。数据类型日益复杂,日益进步的硬件和发展迅速。数据类型日益复杂,日益进步的硬件和网络环境,特别是网络环境,特别是Internet和和Web技术的迅速发展,技术的迅速发展,拓展了数据库的研究领域。拓展了数据库的研究领域。Web数据管理、流数据数据管理、流数据管理、智能数据库、内存数据库、无线传感器网络管理、智能数据库
8、、内存数据库、无线传感器网络数据管理、移动数据库等成为新的研究领域。数据管理、移动数据库等成为新的研究领域。 般舀棺领非咙柒渊墨器蹿驯葫染逃窗惫余郧往祭元问吟道雀争破意鸭赚齿第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 当今的数据库系统是一个大家族,数据模型丰富当今的数据库系统是一个大家族,数据模型丰富多样,新技术层出不穷,应用领域十分广泛。多样,新技术层出不穷,应用领域十分广泛。按照数据库技术的脉络,可从数据模型、与其他按照数据库技术的脉络,可从数据模型、与其他计算机技术的结合、应用领域这三个角度来总结计算机技术的结合、
9、应用领域这三个角度来总结当前数据库技术发展的特点。当前数据库技术发展的特点。10.1.2 数据库发展的特点脊约戏帆聚汝随理册睹振釜讼写撬直购衔淖傣缎泳疥态孩讣皱趟鳖冉咙坯第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 1. 数据模型丰富多样数据模型是数据库系统的核心与基础。数据模型的发数据模型是数据库系统的核心与基础。数据模型的发展经历了最初的层次模型、网状模型到关系模型。展经历了最初的层次模型、网状模型到关系模型。关系模型的提出是数据库发展史上具有划时代意义的关系模型的提出是数据库发展史上具有划时代意义的重大事件。至今,关
10、系数据库系统仍是数据库领域应重大事件。至今,关系数据库系统仍是数据库领域应用最普遍的。用最普遍的。随着数据库应用领域的扩展,数据库管理的数据类型随着数据库应用领域的扩展,数据库管理的数据类型越来越复杂,传统关系数据模型暴露出许多弱点,如越来越复杂,传统关系数据模型暴露出许多弱点,如对复杂对象表示能力较差、语义表达能力较弱、缺乏对复杂对象表示能力较差、语义表达能力较弱、缺乏灵活的建模能力等,对文本、时间、空间、多媒体、灵活的建模能力等,对文本、时间、空间、多媒体、半结构化的半结构化的HTML和和XML等类型的数据处理能力差等。等类型的数据处理能力差等。为此,一些新的数据模型被提出,形成了当今数据
11、库为此,一些新的数据模型被提出,形成了当今数据库领域丰富多样的数据模型。领域丰富多样的数据模型。 适派狰幌乒干遵硝厢照膏感屏菱猪鲁蛀鼠购防体题幕颅便溺秉它工邑觅蔫第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 复杂数据模型 对传统关系模型(对传统关系模型(1NF)扩充,使其能表达)扩充,使其能表达比较复杂的数据类型,支持比较复杂的数据类型,支持“表中表表中表”,这,这样的数据模型称为复杂数据模型。如样的数据模型称为复杂数据模型。如U.C.Berkeley研制的研制的POSTGRES系统,它支持关系统,它支持关系之间的继承,也
12、支持在关系上定义函数和系之间的继承,也支持在关系上定义函数和运算符。运算符。 娜撞韧肺频腐爆瞪准盂飞计毙搭届返箱肆睛姿幢狡笛阮费刃漫末促东久电第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 语义数据模型 提出全新的数据构造器和数据处理原语,以表达复杂提出全新的数据构造器和数据处理原语,以表达复杂的结构和丰富的语义。其特点是蕴含了丰富的语义关的结构和丰富的语义。其特点是蕴含了丰富的语义关联,能更自然地表示客观世界实体间的联系。联,能更自然地表示客观世界实体间的联系。这类模型较有代表性的有函数数据模型(这类模型较有代表性的有函数
13、数据模型(FDM)、语)、语义数据模型(义数据模型(SDM)等。)等。由于这类模型比较复杂,在程序设计语言和其他技术由于这类模型比较复杂,在程序设计语言和其他技术方面缺乏相应支持,因此都没有在方面缺乏相应支持,因此都没有在DBMS实现方面有实现方面有重大突破。重大突破。炳纠陵缠既摹橱貉雍身丰坞纲归芋存弊井都科拎筏眯妆睫躬屠坡怪达偶鄙第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 面向对象数据模型吸收了面向对象方法学的核心概念和面向对象数据模型吸收了面向对象方法学的核心概念和思想,用面向对象方法来描述现实世界中实体的逻辑组思想
14、,用面向对象方法来描述现实世界中实体的逻辑组织、对象间限制、联系等。织、对象间限制、联系等。对象数据模型是具有丰富语义的数据模型,可描述对象对象数据模型是具有丰富语义的数据模型,可描述对象的语义特征,包括命名、标识、联系、对象层次结构、的语义特征,包括命名、标识、联系、对象层次结构、对象的继承和多态特性等。对象的继承和多态特性等。面向对象数据库早期的标准化组织是面向对象数据库早期的标准化组织是ODMG(ObjectDataManagementGroup),),ODMG推出了推出了1.03.0标准。标准。目前,目前,OGM(ObjectManagementGroup)继续进行第)继续进行第4代对
15、象数据库标准研究工作。代对象数据库标准研究工作。面向对象数据模型 息垄辊恃觅严盅坠泳使诲二亨沙镭耀耕韵烟赢薄股荡颁操瘫止搂姨椭和傣第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 对象关系数据模型 它是关系模型与对象模型的结合,在关系数据库的基它是关系模型与对象模型的结合,在关系数据库的基础上扩展了对象模型的某些特征。因此,既保持了关础上扩展了对象模型的某些特征。因此,既保持了关系数据库系统的非过程化数据存取特性和其他优势,系数据库系统的非过程化数据存取特性和其他优势,又能支持对象数据管理,得到了多数数据库厂商的支又能支持对象
16、数据管理,得到了多数数据库厂商的支持。持。SQL3标准也提出了面向对象的扩展,扩展了面向对标准也提出了面向对象的扩展,扩展了面向对象的数据类型,如象的数据类型,如ROWTYPE和抽象数据类型等。和抽象数据类型等。奸盅偏矩臃狙勉笺颧练省扳啊幼对爷社蹄磐鹊卉赶芝乙喝雇异暇位恼戈览第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) XML数据模型 随着随着Internet和和Web应用的普及,越来越多的应用都将应用的普及,越来越多的应用都将数据表示为数据表示为XML形式,形式,XML已成为网络数据交换的标已成为网络数据交换的标准。因此
17、,当前准。因此,当前DBMS都扩展了对都扩展了对XML的处理,支持的处理,支持XML数据类型,支持数据类型,支持XML与关系数据之间的相互转换。与关系数据之间的相互转换。由于由于XML数据模型不同于关系模型和对象模型,故其数据模型不同于关系模型和对象模型,故其灵活性和复杂性导致了许多新问题的出现。灵活性和复杂性导致了许多新问题的出现。XML数据管理技术已成为数据库、信息检索等领域的数据管理技术已成为数据库、信息检索等领域的研究热点。目前还没有统一的研究热点。目前还没有统一的XML数据模型,已提出数据模型,已提出的的XML模型包括模型包括XPathDataModel、DOMModel、XMLIn
18、formationSet和和XMLQueryDataModel。 镜渔鬃董链症弦望得界寂活啄崭支靶阁寸东泡躬边谚欧旁鲤逻褒乍呜树赌第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 半结构数据模型 目前目前Web中大多数数据都是半结构化的或无结构的。中大多数数据都是半结构化的或无结构的。随着随着Web的迅速发展,海量的的迅速发展,海量的Web数据已成为一种新数据已成为一种新的重要信息资源,对的重要信息资源,对Web数据进行有效的访问与管理数据进行有效的访问与管理成为数据库领域面临的新课题。成为数据库领域面临的新课题。半结构化数据
19、存在一定的结构,但这些结构或者没有半结构化数据存在一定的结构,但这些结构或者没有被清晰地描述,或者是经常动态变化的,或者过于复被清晰地描述,或者是经常动态变化的,或者过于复杂不能被传统的模式定义表示。所以,必须针对半结杂不能被传统的模式定义表示。所以,必须针对半结构化数据的特点,研究其数据模型和描述方式。构化数据的特点,研究其数据模型和描述方式。目前,对半结构化数据的描述方式主要有基于逻辑的目前,对半结构化数据的描述方式主要有基于逻辑的描述和基于图的描述两种。描述和基于图的描述两种。 杆婿例肖厌拇聚状毅倘石痹噎些晋挚蛰缕舟颜兔伴俄染吃帖告胎拦不躲梭第10章 数据库新进展第10章 数据库新进展电
20、子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 2. 数据库技术与相关学科技术有机结合各种学科技术与数据库技术有机结合,包括:各种学科技术与数据库技术有机结合,包括:数据库技术与分布处理技术相结合,出现了分布式数据系统;数据库技术与分布处理技术相结合,出现了分布式数据系统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数据库技术与人工智能技术相结合,出现了知识库系统和主数据库技术与人工智能技术相结合,出现了知识库系统和主动数据库系统;动数据库系统;数据库技术与多媒体技术相结合,出现了多媒体数据库系统;数据库技
21、术与多媒体技术相结合,出现了多媒体数据库系统;数据库技术与模糊技术相结合,出现了模糊数据库系统;数据库技术与模糊技术相结合,出现了模糊数据库系统;数据库技术与移动通信技术相结合,出现了移动数据库系统数据库技术与移动通信技术相结合,出现了移动数据库系统等。等。租鞘哩愉悟壮饰佛龄丛婚葵意弯开毋尽疵忠狗插捂驱际情梧醒吹聚棋奖驾第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 3. 数据库技术与特定应用领域有机结合数据库技术应用到特定领域中,与应用领域有机结合,数据库技术应用到特定领域中,与应用领域有机结合,出现了数据仓库、工程数据库
22、、演绎数据库、统计数据出现了数据仓库、工程数据库、演绎数据库、统计数据库、空间数据库和科学数据库等多种数据库,使数据库库、空间数据库和科学数据库等多种数据库,使数据库的应用范围不断扩大,为数据库技术增添了新的技术内的应用范围不断扩大,为数据库技术增添了新的技术内涵。涵。面向特定领域的数据库系统,也称为特种数据库系统或面向特定领域的数据库系统,也称为特种数据库系统或专用数据库系统。这些数据库系统虽然采用不同的数据专用数据库系统。这些数据库系统虽然采用不同的数据模型,但都带有明显的对象模型特征。在具体实现时,模型,但都带有明显的对象模型特征。在具体实现时,有的是对关系数据库系统进行扩充,有的则是重
23、新设计有的是对关系数据库系统进行扩充,有的则是重新设计与开发的。与开发的。瘫轰蹲焊赢思岛骏男办耿闯杖邹圃浚水猖捧缎惶厂踩原印芜挑赦钵湘侵死第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.1.3 数据库技术的研究方向随着计算机软、硬件技术的进步、随着计算机软、硬件技术的进步、Internet和和Web技术的技术的发展,数据库系统所管理的数据以及应用环境发生了很发展,数据库系统所管理的数据以及应用环境发生了很大变化,数据库技术面临着新的挑战。大变化,数据库技术面临着新的挑战。主要表现在:新的数据源不断出现,数据类型越来越多
24、、主要表现在:新的数据源不断出现,数据类型越来越多、数据结构越来越复杂、数据量越来越大,对数据使用的数据结构越来越复杂、数据量越来越大,对数据使用的安全性提高,对数据库理解和知识获取的要求增加。安全性提高,对数据库理解和知识获取的要求增加。这些新的挑战性问题必将推动数据库技术的进一步发展。这些新的挑战性问题必将推动数据库技术的进一步发展。 穷妆顽速湛槽阔邻弱祁繁者芳猖括蓖拭扔又槐擒猩缠嵌眶拐眠吻铱浊蒜佛第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 1. 面向对象数据库面向对象数据库系统支持面向对象数据模型。可以将一面向对象
25、数据库系统支持面向对象数据模型。可以将一个面向对象数据库系统看做一个持久的、可共享的对象个面向对象数据库系统看做一个持久的、可共享的对象库的存储者和管理者。库的存储者和管理者。面向对象数据库支持面向对象技术中的对象与类、继承面向对象数据库支持面向对象技术中的对象与类、继承和多态特性。它将数据作为能自动重新得到和共享的对和多态特性。它将数据作为能自动重新得到和共享的对象存储,包含在对象中的是完成每一项数据库事务的处象存储,包含在对象中的是完成每一项数据库事务的处理指令。这些对象可能包含不同类型的数据,包括传统理指令。这些对象可能包含不同类型的数据,包括传统的数据和处理过程,也包括声音、图像和视频
26、等数据。的数据和处理过程,也包括声音、图像和视频等数据。对象可以共享和重用。对象可以共享和重用。 回咋悯亭饶乖狙裙田纫烟住鹊手乞悯聋低仔臀洞知莱甭替舔侈帮蛆梁汞骆第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 2. 分布式数据库分布式数据库是指物理上分散在网络各节点上、而逻分布式数据库是指物理上分散在网络各节点上、而逻辑上属于同一个系统的数据集合。辑上属于同一个系统的数据集合。它具有数据的分布性和数据库间的逻辑协调性两大特它具有数据的分布性和数据库间的逻辑协调性两大特点。分布性是指数据不是存放在单个计算机的存储设点。分布性是
27、指数据不是存放在单个计算机的存储设备上,而是按全局需要将数据划分为一定结构的数据备上,而是按全局需要将数据划分为一定结构的数据子集,分散地存储在各个节点上。逻辑协调性是指各子集,分散地存储在各个节点上。逻辑协调性是指各场地上的数据子集相互间由严密的约束规则加以限定,场地上的数据子集相互间由严密的约束规则加以限定,而逻辑上是一个整体。而逻辑上是一个整体。无叁概馁鞠拈榨敌鸟姓襄茧妹胀辞糟乡计婿韵陌即倔危曰规维脾巾灭拢鸣第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 3. 多媒体数据库多媒体是指多种媒体,如数字、字符、文本、图形、
28、多媒体是指多种媒体,如数字、字符、文本、图形、图像、声音和视频等的有机集成。其中数字、字符等图像、声音和视频等的有机集成。其中数字、字符等称为格式化数据,文本、图形、图像、声音和视频等称为格式化数据,文本、图形、图像、声音和视频等称为非格式化数据。多媒体数据具有数据量大、处理称为非格式化数据。多媒体数据具有数据量大、处理复杂等特点。复杂等特点。多媒体数据库实现对格式化和非格式化的多媒体数据多媒体数据库实现对格式化和非格式化的多媒体数据的存储、管理和查询,使数据库能够表示和处理多媒的存储、管理和查询,使数据库能够表示和处理多媒体数据。体数据。 恿辞凯喊抄据孽侨毒扬帝徐纸鹰乘骸偷辅耻重抡晰宦尖荆戴
29、价腔沤俩旱草第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 4. 并行数据库并行数据库是数据库技术与并行处理技术相结合的产物。并行数据库是数据库技术与并行处理技术相结合的产物。并行数据库发挥多处理机结构的优势,将数据库分布存并行数据库发挥多处理机结构的优势,将数据库分布存储,利用多个处理机对数据进行并行处理,从而解决储,利用多个处理机对数据进行并行处理,从而解决I/O瓶颈问题。通过采用先进的并行查询技术,开发查询间瓶颈问题。通过采用先进的并行查询技术,开发查询间并行、查询内并行以及操作内并行,可大大提高查询效并行、查询内并行
30、以及操作内并行,可大大提高查询效率。率。并行数据库的目标是提供一个高性能、高可用性、高扩并行数据库的目标是提供一个高性能、高可用性、高扩展性的数据库系统,并且性价比比相应大型机上的展性的数据库系统,并且性价比比相应大型机上的DBMS高得多。高得多。 用约诵加焦咀因馁妆台纠双洒烹肤焦矛馋垄梆陶钎孩吝橡揣凝辉岁碎忠剿第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 5. 知识数据库知识数据库是知识、经验、规则和事实的集合。知识知识数据库是知识、经验、规则和事实的集合。知识数据库系统的功能是把大量的事实、规则和概念组成数据库系统的功
31、能是把大量的事实、规则和概念组成的知识存储起来,进行管理,并向用户提供方便快速的知识存储起来,进行管理,并向用户提供方便快速的查询手段。的查询手段。知识数据库系统应具备对知识的表示方法、对知识系知识数据库系统应具备对知识的表示方法、对知识系统化的组织管理、知识库的维护、知识的获取与学习、统化的组织管理、知识库的维护、知识的获取与学习、知识库的查询等功能。知识数据库系统是数据库技术知识库的查询等功能。知识数据库系统是数据库技术与人工智能的结合。与人工智能的结合。 摘虫馅蝶否倦屋亿皿袄瞎托蜒灌蕉颖脯疮遭冶坍愚认悉乍花摹蔬矩踊克鳃第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础
32、教程(SQL Server平台)配套电子教案) 6. 模糊数据库模糊数据库的目标是使数据库能够存储以各种形式表示模糊数据库的目标是使数据库能够存储以各种形式表示的模糊数据。的模糊数据。模糊数据库系统是数据库技术与模糊技术的结合。模糊数据库系统是数据库技术与模糊技术的结合。模糊数据库技术近年来在一些领域得到了一定的应用,模糊数据库技术近年来在一些领域得到了一定的应用,如医疗诊断、工程设计、过程控制、案情侦破等,显示了如医疗诊断、工程设计、过程控制、案情侦破等,显示了其良好的应用前景。其良好的应用前景。殖擒赔遂帮容京恿滩突猪蚀率侠县瞎涅巳园亩就册浚缓苏瞥汤桩拍法月叭第10章 数据库新进展第10章
33、数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 7. 移动数据库 移动数据库是指支持移动计算环境的数据库。移动数据库是指支持移动计算环境的数据库。 它使得计算机或其他信息设备在没有固定的物理连接设它使得计算机或其他信息设备在没有固定的物理连接设备相连的情况下,能够传输数据。备相连的情况下,能够传输数据。 移动计算的作用在于,将有用、准确、及时的信息与中移动计算的作用在于,将有用、准确、及时的信息与中央信息系统相互作用,分担中央信息系统的计算压力,央信息系统相互作用,分担中央信息系统的计算压力,使信息能及时地提供给在任何时间和地点需要它的用户。使信息能及时地
34、提供给在任何时间和地点需要它的用户。 武弧认寥裂辜缅咬树惦亦耳灭擅叹又永巳寓粗督褪卑乾轻钥骄报评拈学太第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 8. 专用数据库在地理、气象、科学、统计、工程等应用领域,数据库在地理、气象、科学、统计、工程等应用领域,数据库要适用于不同的环境,解决不同的问题。要适用于不同的环境,解决不同的问题。在这些领域应用的数据管理完全不同于商业事务管理,在这些领域应用的数据管理完全不同于商业事务管理,并日益显示其重要性和迫切性。并日益显示其重要性和迫切性。工程数据库、科学数据库、统计数据库、空间数据
35、库等工程数据库、科学数据库、统计数据库、空间数据库等专用数据库近年来得到了很大发展,在相应的应用领域专用数据库近年来得到了很大发展,在相应的应用领域有的已经得到了较好的应用。有的已经得到了较好的应用。 赊拉彩缔凶芍藻岳貉危勒棺假易牧泰擒心嗡舶鸥溺颂额辣目监抬李阉普低第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 9. 数据库中的知识发现人工智能与数据库技术相结合,促进了数据库中知人工智能与数据库技术相结合,促进了数据库中知识发现(识发现(KnowledgeDiscoveryfromData,KDD)的研究。的研究。用数据库作
36、为知识源,把逻辑学、统计学、机器学用数据库作为知识源,把逻辑学、统计学、机器学习、模糊学、数据分析、可视化计算等学科成果综习、模糊学、数据分析、可视化计算等学科成果综合在一起,进行从数据库中发现知识的研究,使得合在一起,进行从数据库中发现知识的研究,使得数据库不仅能查询存放在数据库中的数据,而且上数据库不仅能查询存放在数据库中的数据,而且上升到对数据库中数据的整体特征的认识,获得与数升到对数据库中数据的整体特征的认识,获得与数据库中数据相吻合的中观或宏观的知识。据库中数据相吻合的中观或宏观的知识。在这个领域,目前研究的热点集中在数据仓库和数在这个领域,目前研究的热点集中在数据仓库和数据挖掘上。
37、据挖掘上。 以缀杂旗邻茂毕责沥犊信削甄柱熔屈搐迎抿泽蠕逾吩蚌轧仔款释桅颈芹奉第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 数据仓库和数据挖掘是作为两种独立的信息技数据仓库和数据挖掘是作为两种独立的信息技术出现的。术出现的。数据仓库是不同于数据库的数据组织和存储技数据仓库是不同于数据库的数据组织和存储技术,它从数据库技术发展而来并为决策服务。术,它从数据库技术发展而来并为决策服务。数据挖掘通过对各类数据源的数据进行分析,数据挖掘通过对各类数据源的数据进行分析,获得具有一定可信度的知识。获得具有一定可信度的知识。它们从不同侧面
38、完成对决策过程的支持,相互它们从不同侧面完成对决策过程的支持,相互间有一定的内在联系。间有一定的内在联系。将它们集成到一个系统中,形成基于数据挖掘将它们集成到一个系统中,形成基于数据挖掘的的OLAP工具,可以更加有效地提高决策支持能工具,可以更加有效地提高决策支持能力。力。 10.2数据仓库与数据挖掘数据仓库与数据挖掘裁瓷劳琳搜晕吸腥狄啥弊撇钟矣浊舰萝散则叶叠某裂乐畦漳剃客轩抿酋聘第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.2.1 数据仓库20世纪世纪80年代中期,数据仓库之父年代中期,数据仓库之父WilliamH
39、.Inmon在其建立数据仓库在其建立数据仓库(BuildingtheDataWarehouse)一书中提出了数据仓库的概念。一书中提出了数据仓库的概念。 肤矮诫暮是矗猜褪到侄铭会拱耕俊啥梁霸没硅罐途拭浪筏图粤畏抢冶窃虞第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) W.H.Inmon对数据仓库的定义如下:对数据仓库的定义如下:数据仓库是面向主题的、集成的、相数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,对稳定的、反映历史变化的数据集合,用以支持管理决策的决定过程。这个定用以支持管理决策的决定过程。这个定义
40、说明了数据仓库中数据的组织方式以义说明了数据仓库中数据的组织方式以及建立数据仓库的目的。及建立数据仓库的目的。 1. 数据仓库的概念 误入境震泊纂更绑午温焕绩拈职捆垛熄烹乌逮丑镐绝佰件鲤我臼蒲回龟立第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 2. 数据仓库的特点 (1)数据仓库是面向主题()数据仓库是面向主题(SubjectOriented)的。的。(2)数据仓库中的数据是集成()数据仓库中的数据是集成(Integrated)的。)的。(3)数据仓库中的数据是相对稳定()数据仓库中的数据是相对稳定(Non-Volatil
41、e)的。)的。(4)数据仓库反映历史变化()数据仓库反映历史变化(TimeVariant)奔箔恋串申浩簇妥卫亚煽怨酞狗佳谓链师殷藩雍服狐近香仰眨夸眷揽最协第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 3. 数据仓库与传统数据库系统的比较 类别类别项项 目目数数 据据 仓仓 库库传统数据库系统传统数据库系统数据模型数据模型关系模型、对象模型(多维模型)关系模型、对象模型(多维模型)关系模型为主(平面模型)关系模型为主(平面模型)数据内容数据内容与决策管理相关的支持信息与决策管理相关的支持信息与日常事务处理有关的数据与日常事务
42、处理有关的数据数据特性数据特性集成、详细和综合数据集成、详细和综合数据详细数据详细数据数据来源数据来源数据来源多,内外皆有数据来源多,内外皆有以内部数据为主以内部数据为主数据稳定性数据稳定性较稳定,极少更新较稳定,极少更新频繁更新频繁更新性能度量性能度量查询吞吐量查询吞吐量事务吞吐量事务吞吐量开发方法开发方法利用迭代的开发方法,按系统结构和利用迭代的开发方法,按系统结构和交叉功能的定制形式集成,以数据驱交叉功能的定制形式集成,以数据驱动为主动为主利用规范的开发方法,按功能分项利用规范的开发方法,按功能分项和具体事务管理功能集成,以事件和具体事务管理功能集成,以事件驱动方式为主驱动方式为主丙瞩脏
43、腆舵琶带扮细纶损救漾帅埋储搂旨叭铂柞未芒撬相沛来敛扔阐踪兰第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 信息处理:支持查询和基本的统计分析,并使信息处理:支持查询和基本的统计分析,并使用图表、图或表等多种形式进行报告。数据仓用图表、图或表等多种形式进行报告。数据仓库信息处理的当前趋势是构造低代价的基于库信息处理的当前趋势是构造低代价的基于Web的访问工具,并与的访问工具,并与Web浏览器集成。浏览器集成。分析处理:支持基本的联机分析处理分析处理:支持基本的联机分析处理(OLAP)操作。与信息处理相比,联机分析处)操作。与信
44、息处理相比,联机分析处理的主要优势是,支持数据仓库的多维数据分理的主要优势是,支持数据仓库的多维数据分析。析。数据挖掘:支持知识发现,包括找出隐藏在数数据挖掘:支持知识发现,包括找出隐藏在数据仓库中的模式和关联,构造分析模型,进行据仓库中的模式和关联,构造分析模型,进行分类和预测,并使用可视化工具提供挖掘结果。分类和预测,并使用可视化工具提供挖掘结果。4. 数据仓库的应用 裳豫帚吐咐孺朝灶痉魂济确申送鲸德盘讫从茅粘脓倾乘确如据赘赃辣案撰第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 5. 数据仓库的构建(1)收集和分析业务需
45、求。)收集和分析业务需求。(2)建立数据模型和数据仓库的物理设计。)建立数据模型和数据仓库的物理设计。(3)定义数据源。)定义数据源。(4)选择数据仓库技术和平台。)选择数据仓库技术和平台。(5)从操作型数据库中抽取、净化和转换数据到数据仓)从操作型数据库中抽取、净化和转换数据到数据仓库。库。(6)选择访问和报表工具。)选择访问和报表工具。(7)选择数据库连接软件。)选择数据库连接软件。(8)选择数据分析和数据展示软件。)选择数据分析和数据展示软件。(9)更新数据仓库。)更新数据仓库。 把病乳咀导太莫团庭佰搔腔壳可逆积脓蔬芒集扇开从诌见烈戎符臻瘸盔才第10章 数据库新进展第10章 数据库新进展
46、电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.2.2 数据挖掘在在20世纪世纪80年代,随着计算机技术和通信技术的年代,随着计算机技术和通信技术的迅速发展,大型数据库系统得到了广泛应用,企迅速发展,大型数据库系统得到了广泛应用,企业积累的数据量急剧增加。业积累的数据量急剧增加。然而,现有数据库系统主要进行的是事务性的处然而,现有数据库系统主要进行的是事务性的处理,不能发现数据内部隐藏的规律或规则。理,不能发现数据内部隐藏的规律或规则。因此,人们亟需一种能从海量数据中发现潜在知因此,人们亟需一种能从海量数据中发现潜在知识的工具,以解决数据爆炸与知识贫乏的矛盾。识
47、的工具,以解决数据爆炸与知识贫乏的矛盾。数据挖掘(数据挖掘(DataMining,DM)技术就是在这样)技术就是在这样的背景下产生的。的背景下产生的。 腹港蛆填尾熏岩树朔耀门尊媒采淳测啡铱奶亦砰装旭聊跋藐矿深壕祷一躺第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 1. 数据挖掘的概念 数据挖掘是从大量的、不完全的、有噪数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取潜声的、模糊的、随机的数据中,提取潜在的、有价值的模式和数据间关系(或在的、有价值的模式和数据间关系(或知识)的过程。知识)的过程。 串郧士蓝坎
48、倾款驰裔累鸭伎膝膊钾蟹舱策闸提哺看击潦寡辣药穷奄邵悍噪第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 2. 数据挖掘的数据对象原则上,数据挖掘可以在任何类型的信原则上,数据挖掘可以在任何类型的信息载体上进行。息载体上进行。数据对象可以是结构化的数据源,包括数据对象可以是结构化的数据源,包括关系数据库、数据仓库及各类专业数据关系数据库、数据仓库及各类专业数据库;也可以是半结构化的数据源,如文库;也可以是半结构化的数据源,如文本数据、多媒体数据库和本数据、多媒体数据库和Web数据。数据。苛深稳笋皱抛萤瘪熔侦粉奎值欣咯溜节样毁薯言
49、腑泞甄崎败华如粥以攘麦第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 3. 数据挖掘发现的知识模式分类模式分类模式聚类模式聚类模式 时间序列模式时间序列模式 回归模式回归模式 关联模式关联模式 序列模式序列模式 讳够憨恰汁周婪六户乌畴欧专仲瞳肝晨杨限猛贰税迭藉棍阂邱闲贰徊袋吼第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 4. 数据挖掘的主要技术(1)统计分析方法)统计分析方法(2)决策树方法)决策树方法(3)人工神经网络)人工神经网络(4)遗传算法)遗传
50、算法(5)模糊技术)模糊技术(6)粗糙集()粗糙集(RoughSet)方法)方法(7)可视化技术)可视化技术 晕篇蕾盾腔哩茨常胃绢裔远爬赎窘镜宛惯蓝驾诬占龄快院硫人椎强僻张夯第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 5. 数据挖掘的应用(1)金融行业)金融行业(2)医疗保健)医疗保健(3)市场零售行业)市场零售行业(4)制造业)制造业(5)科学研究领域)科学研究领域 椿肄快喻抿谜拜眶考第京语贼袄中吁垃山催碴语氟庇搞灌渐便虎浚拖显贮第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Ser
51、ver平台)配套电子教案) 10.2.3 数据仓库与数据挖掘数据仓库和数据挖掘作为决策支持的新数据仓库和数据挖掘作为决策支持的新技术,近十几年来得到了迅速发展。技术,近十几年来得到了迅速发展。作为数据挖掘对象,数据仓库技术的产作为数据挖掘对象,数据仓库技术的产生和发展为数据挖掘技术开辟了新领域,生和发展为数据挖掘技术开辟了新领域,也提出了新的要求和挑战。也提出了新的要求和挑战。数据仓库和数据挖掘是相互影响、相互数据仓库和数据挖掘是相互影响、相互促进的。促进的。 肿扼皑五沽鸵峪忻示郴恶意掩元灾拙业咨苛睡在秀族刺改淹锣鞋退逼愤羞第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础
52、教程(SQL Server平台)配套电子教案) 数据仓库与数据挖掘(1)数数据据仓仓库库为为数数据据挖挖掘掘提提供供了了广广泛泛的的数数据源。据源。(2)数据仓库为数据挖掘提供了支持平台。)数据仓库为数据挖掘提供了支持平台。(3)数据挖掘为数据仓库提供了决策支持。)数据挖掘为数据仓库提供了决策支持。(4)数数据据挖挖掘掘为为数数据据仓仓库库提提供供了了广广泛泛的的技技术支持。术支持。脚枢至捉腮菊碑苔檬釉鸵硬礼跳冀追携矩词捏垦已几匙忘枣瞎疹奶邯搔熬第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.3XML数据管理数据管理可
53、扩展标记语言可扩展标记语言XML(eXtensibleMarkupLanguage)是)是W3C组织于组织于1998年年2月发布的标准。月发布的标准。它是为了克服它是为了克服HTML缺乏灵活性和伸缩性缺乏灵活性和伸缩性的缺点以及的缺点以及SGML过于复杂、不利于软件过于复杂、不利于软件应用的缺点而发展起来的一种元标记语言。应用的缺点而发展起来的一种元标记语言。肢昔檄榨铡兜事爷萎房慷掠赣侈镀豪挠拼某馅瘪嘘翠动乾轿裔斟纱史布佑第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.3.1 XML概述XML是在吸取了是在吸取了HTM
54、L和和SGML优点的基优点的基础上形成的,已成为互联网上信息交换和础上形成的,已成为互联网上信息交换和表示的标准。表示的标准。XML具有灵活的模式,可满足具有灵活的模式,可满足Web环境中环境中异构数据集成的要求。异构数据集成的要求。 截畸作姻胀商滑桥持冗据瞬简梆合囚嘱柄戌响菜丘萌亚谱辙邱葬营诗郑缮第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.3.2 XML数据模型XML数据的基本形式是数据的基本形式是XML文档。文档。XML是一种定义是一种定义“标记标记”(Markup)的规则,)的规则,即即XML定义了标记文本或
55、文档的一套规则,用定义了标记文本或文档的一套规则,用户使用这些规则定义所需的标记。户使用这些规则定义所需的标记。XML标记是可以扩展的,用户可以根据需要定标记是可以扩展的,用户可以根据需要定义新的标记。并且,用户可以根据需要给标记义新的标记。并且,用户可以根据需要给标记取任何名字。取任何名字。雾态线芍街挥泪列亏播茶骂蕊羌耪歧坠苯挨绝描导颗践习噎革慢紧柠陈彪第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 1. XML文档XML数据存储的最基本形式是数据存储的最基本形式是XML文档文档(Document)。)。一个文档就是一个连
56、续的字符流。一个文档就是一个连续的字符流。字符流中的标记将它们分割为更小的语字符流中的标记将它们分割为更小的语义单位。义单位。XML的标记分为的标记分为5种类型:元素、属性、种类型:元素、属性、注释、处理指令和实体。注释、处理指令和实体。 霸飘虱牧飘平劝炼跑拿松女肖斋排熏搪伙询晦恃屁罕颈禄了燕匙鼻桔菲斜第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 示例 【例【例10.1】创建一个用于保存人的信息的】创建一个用于保存人的信息的XML文档文档(文件名为(文件名为person.xml)。注意:每行前面的序)。注意:每行前面的序号
57、是为了便于说明而加的,不是号是为了便于说明而加的,不是XML文档的内文档的内容。容。1:2:3:4:李平李平5:11/10/19866:130333001107: 皇乒淤磕今瘫沂榆书矢峙互恒腥羞潞棠项泉获鹰待主套配涨驼个兑安消青第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 2. XML文档模式XML文档模式用于描述文档模式用于描述XML的逻辑结构。的逻辑结构。有两种描述有两种描述XML逻辑结构的方式:逻辑结构的方式:文档类型定义(文档类型定义(DocumentTypeDefinition,DTD)XML模式(模式(XMLS
58、chema) 渴孟圣敝秒诀患沉椎萤抬女扼狮传缠律纫链瘴四争芳沈赁氛参志岳疥窥旅第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) (1) 文档类型定义DTD DTD定义了文档的逻辑结构,规定了文定义了文档的逻辑结构,规定了文档中所使用的元素、实体、属性、元素与档中所使用的元素、实体、属性、元素与实体间的关系等。使用实体间的关系等。使用DTD可验证数据可验证数据的有效性,保证数据交换与共享的要求。的有效性,保证数据交换与共享的要求。DTD是一组声明,这组声明通过定义一是一组声明,这组声明通过定义一些规则来界定些规则来界定XML数据
59、需要满足的结构数据需要满足的结构和内容的要求。和内容的要求。 淌吗苏躁记懒底阵轨伤匝引禄泉赢虫灾歌殃扼推哼弛防克咆饥链峭壳侦辕第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 示例【例【例10.2】对于例对于例10.1中的中的XML文档,其文档,其DTD文文档如下:档如下:歼林静碧设萄翰玉椿躺刃留础访黎争锚缴囤执捆衷槛峙蒲嫁惩彭拐亮斑豺第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) (2) XML模式(XML Schema)XMLSchema是在是在DTD之
60、后的第二代用于之后的第二代用于描述描述XML逻辑结构的标准。逻辑结构的标准。XMLSchema用一套预先定义的用一套预先定义的XML元元素和属性创建,这些元素和属性定义了素和属性创建,这些元素和属性定义了XML文档的结构和内容模式。文档的结构和内容模式。 需鞍淹宋佳罢鹏瞥碴萧禄癣埔汾钝疯砖淘噪弄杨阶曼豪追欢冶烙浴蔷骇坚第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 示例 对于例对于例10.1中的中的XML文档,其文档,其XMLSchema如下:如下: 挤剖盯还贯曹蘸咆厚肾禁宇瞬甚范验倪憾李尔郑装搓容垄睬燎铰炬锡颗病第10章
61、数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) 10.3.3 XML数据查询数据查询是数据库的重要功能。数据查询是数据库的重要功能。XML数据查询的描述形式较多,包括数据查询的描述形式较多,包括Lorel、XML-QL、XML-GL、Quilt、XPath、XQuery等。等。其中其中XPath和和XQuery是是W3C组织推荐的组织推荐的XML数据查询语言,是当前这类处理中数据查询语言,是当前这类处理中的代表性语言,在当前的代表性语言,在当前XML数据查询中数据查询中处于重要位置。处于重要位置。一春翱飞诉战咒迢渠帘度姜荐余膊侵筑硷世
62、森衍涕陇寇瘪琅蒸焉症摘料拘第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) XPath XPath将将XML文档看做树,将元素、属性、注文档看做树,将元素、属性、注释和文本看做树的节点。从根到每个节点都存释和文本看做树的节点。从根到每个节点都存在一个节点序列,称为节点的路径表达式。在一个节点序列,称为节点的路径表达式。XPath以以“/”分隔路径表达式中的各个节点,分隔路径表达式中的各个节点,并允许加入路径操作符和查询谓词。并允许加入路径操作符和查询谓词。这样这样XPath路径表达式就可以进行导航式访问。路径表达式就可以进行导
63、航式访问。衬军框狗揪皆陶苫姆傻铣圈遏虞恳死旱栓饲汞缺避呕推距浅耶腆图醒字扬第10章 数据库新进展第10章 数据库新进展电子工业出版社(数据库基础教程(SQL Server平台)配套电子教案) XQuery XQuery是是W3C开发的与开发的与SQL风格接近的风格接近的XML数据查询语言。数据查询语言。它是一种非过程语言,其中引进了变量,使用它是一种非过程语言,其中引进了变量,使用较为灵活。较为灵活。可查询各种可查询各种XML数据源,包括数据源,包括XML文档、文档、XML数据库以及基于对象的存储等。数据库以及基于对象的存储等。 伞晃艺谦跋融洱捏锻讳瘴矛捻脚卿盯汲坝案澎惩访奴惕哮狙辑赢暖驻钩幕第10章 数据库新进展第10章 数据库新进展