关系理论补充: 关系数据库2.1 关系数据库概述 2.2 关系数据结构 2.3 关系的完整性 2.4 关系代数关系数据库简介• 系统而严格地提出关系模型的是美国IBM公 司的E.F.Codd –1970年提出关系数据模型 •E.F.Codd, “A Relational Model of Data for Large Shared Data Banks”, 《Communication of the ACM》,1970 –之后,提出了关系代数和关系演算的概念 –1972年提出了关系的第一、第二、第三范 式 –1974年提出了关系的BC范式关系数据库简介• 关系数据库应用数学方法来处理数据库中 的数据• 80年代后,关系数据库系统成为最重要、 最流行的数据库系统关系数据库简介• 典型实验系统 –System R –University INGRES • 典型商用系统 –ORACLE –SYBASE –DB2 –SQL Server –INFORMIX –INGRES第2章 关系数据库2.1 关系数据库概述 2.2 关系数据结构 2.3 关系的完整性 2.4 关系代数 2.5 关系演算 2.6 关系数据库管理系统 2.7 小结2.1 关系数据库概述• 关系数据库系统是支持关系模型的数据库 系统• 关系模型的组成–关系数据结构 –关系操作集合 –关系完整性约束1. 关系数据结构• 单一的数据结构----关系 –现实世界的实体以及实体间的各种联系均 用关系来表示• 数据的逻辑结构----二维表 –从用户角度,关系模型中数据的逻辑结构 是一张二维表。
2. 关系操作• 1) 常用的关系操作• 2) 关系操作的特点• 3) 关系数据语言的种类• 4) 关系数据语言的特点关系操作 (续)• 1) 常用的关系操作–查询 •选择、投影、连接、除、并、交、差–数据更新 •插入、删除、修改–查询的表达能力是其中最主要的部分关系操作(续)• 2) 关系操作的特点–集合操作方式,即操作的对象和结果都是 集合•非关系数据模型的数据操作方式:一次一记录•文件系统的数据操作方式关系操作(续)• 3) 关系数据语言的种类–关系代数语言 •用对关系的运算来表达查询要求•典型代表:ISBL关系操作(续)• 关系数据语言的种类(续) –关系演算语言:用谓词来表达查询要求 •元组关系演算语言 –谓词变元的基本对象是元组变量 –典型代表:APLHA, QUEL •域关系演算语言 –谓词变元的基本对象是域变量 –典型代表:QBE –具有关系代数和关系演算双重特点的语言 •典型代表:SQL关系操作(续)• 4) 关系数据语言的特点–关系语言是一种高度非过程化的语言 •存取路径的选择由DBMS的优化机制来 完成 •用户不必用循环结构就可以完成数据操 作–能够嵌入高级语言中使用–关系代数、元组关系演算和域关系演算三 种语言在表达能力上完全等价3. 关系的三类完整性约束• 实体完整性 –通常由关系系统自动支持 • 参照完整性 –早期系统不支持,目前大型系统能自动支 持 • 用户定义的完整性 –反映应用领域需要遵循的约束条件,体现 了具体领域中的语义约束 –用户定义后由系统支持第2章 关系数据库2.1 关系数据库概述 2.2 关系数据结构 2.3 关系的完整性 2.4 关系代数 2.5 关系演算 2.6 关系数据库管理系统 2.7 小结2.2 关系数据结构• 关系模型建立在集合代数的基础上• 关系数据结构的基本概念 –关系 –关系模式 –关系数据库2.2 关系数据结构• 1.关系• 2.关系模式• 3.关系数据库一、 关系• ⒈ 域(Domain)• 2. 笛卡尔积(Cartesian Product)• 3. 关系(Relation)⒈ 域(Domain)• 域是一组具有相同数据类型的值的集合。
–例 •整数 •实数 •指定长度的字符串集合 •介于某个取值范围的整数 •{‘男’,‘女’} •介于某个取值范围的日期2. 笛卡尔积(Cartesian Product)• 1) 笛卡尔积给定一组域D1,D2,… ,Dn,这些域中 可以有相同的D1,D2,… ,Dn的笛卡尔积 为:D1×D2×… ×Dn={(d1, d2, … , dn)|diDi, i=1, 2, … , n}–所有域的所有取值的一个组合 –不能重复例如给出三个域: D1 = 姓名 = {王平,李丽,张晓刚};D2 = 性别 = {男,女};D3 = 年龄 = {19,20}. 则D1,D2,D3的笛卡儿积为D1×D2×D3 姓名性别别年龄龄 王平男19 王平男20 王平女19王平女20 李丽丽男19 李丽丽男20 李丽丽女19 李丽丽女20 张晓刚张晓刚男19 张晓刚张晓刚男20 张晓刚张晓刚女19 张晓刚张晓刚女20笛卡尔积(续)• 2) 元组(Tuple) –笛卡尔积中每一个元素(d1,d2,… ,dn)叫作 一个n元组(n-tuple)或简称元组例• 3) 分量(Component) –笛卡尔积元素(d1,d2,… ,dn)中的每一个值 di叫作一个分量。
例笛卡尔积(续)• 4) 基数(Cardinal number) –若Di(i=1,2,… ,n)为有限集,其基 数为mi(i=1,2,… ,n),则D1×D2×… ×Dn的基数M为:在上例中,基数:2×2×3=12,即 D1×D2×D3共有2×2×3=12个元组笛卡尔积(续)• 5)笛卡尔积的表示方法–笛卡尔积可表示为一个二维表表中的每 行对应一个元组,表中的每列对应一个域在上例中,12个元组可列成一张二维表 笛卡尔积(续)3. 关系(Relation)• 1) 关系 –D1×D2×… ×Dn的子集叫作在域D1, D2, … , Dn上的关系,表示为R(D1,D2,… ,Dn)R:关系名 n:关系的目或度(Degree )从D1×D2×D3中取出有用的元组,所构造的学生关系如表所示姓名性别年龄王平男20李丽女20张晓刚男19关系(续)• 1) 关系(续) –注意 •关系是笛卡尔积的有限子集无限关系在 数据库系统中是无意义的 •由于笛卡尔积不满足交换律,即(d1,d2,… ,dn )≠(d2,d1,… ,dn )但关系满足交换律,即 (d1,d2 ,… ,di ,dj ,… ,dn)=(d1,d2 ,… , dj , di,… ,dn) (i,j = 1,2,…,n)解决方法:为关系的每个列附加一个属性 名以取消关系元组的有序性关系(续)例 在表2.1 的笛卡尔积中取出有实际意义的元组来构造关系 关系:SAP(SUPERVISOR,SPECIALITY,POSTGRADUATE) –关系名,属性名 假设:导师与专业:1:1,导师与研究生:1:n 于是:SAP关系可以包含三个元组{ (张清玫,信息专业,李勇),(张清玫,信息专业,刘晨),(刘逸,信息专业,王敏) }关系(续)• 2) 元组 –关系中的每个元素是关系中的元组,通常用 t 表 示。
• 3) 单元关系与二元关系 –当n=1时,称该关系为单元关系(Unary relation ) –当n=2时,称该关系为二元关系(Binary relation )关系(续)• 4) 关系的表示–关系也是一个二维表,表的每行对应一个 元组,表的每列对应一个域关系(续)• 5) 属性–关系中不同列可以对应相同的域,为了加 以区分,必须对每列起一个名字,称为属性( Attribute) –n目关系必有n个属性关系(续)• 6) 码 –候选码 •若关系中的某一属性组的值能唯一地标识 一个元组,则称该属性组为候选码(Candidate key) •候选码的诸属性称为主属性(Prime attribute) •不包含在任何侯选码中的属性称为非码属 性(Non-key attribute) •在最简单的情况下,候选码只包含一个属 性在最极端的情况下,关系模式的所有属性组是 这个关系模式的候选码,称为全码(All-key)关系(续)• 码(续)–主码 •若一个关系有多个候选码,则选定其中一 个为主码(Primary key)2. 关系中的基本名词1) 元组:关系表中的每一横行称作一个元组,组成元组的元素为分量。
2) 属性:关系中的每一列称为一个属性3) 候选码、主码、全码:若关系的候选码中只包含一个属性,则称它为单属性码;若候选码是由多个属性构成的,则称为它为多属性码若关系中只有一个候选码,且这个候选码中包括全部属性,则这种候选码为全码4) 主属性和非主属性:关系中,候选码中的属性称为主属性,不包含在任何候选码中的属性称为非主属性1) 基本表:关系数据库中实际存在的表,是实际 存储数据的逻辑表示 2) 视图表:视图表是由基本表或其他视图表导出的表 3) 查询表:查询表是指查询结果表或查询中生成的临时 表3. 数据库中关系的类型1) 同一属性的数据具有同质性 2) 同一关系的属性名具有不能重复性 3) 关系中的列位置具有顺序无关性 4) 关系具有元组无冗余性 5) 关系中的元组位置具有顺序无关性 6) 关系中每一个分量都必须是不可分的数据项 4. 数据库中基本关系的性质关系(续)• 7) 三类关系–基本关系(基本表或基表) •实际存在的表,是实际存储数据的逻辑表 示–查询表 •查询结果对应的表–视图表 •由基本表或其他视图表导出的表,是虚表 ,不对应实际存储的数据关系(续)• 8) 基本关系的性质 –① 列是同质的(Homogeneous)•每一列中的分量是同一类型的数据,来自 同一个域。
–② 不同的列可出自同一个域•其中的每一列称为一个属性 •不同的属性要给予不同的属性名关系(续)例: 上例中也可以只给出两个域: 人(PERSON)=张清玫,刘逸,李勇,刘晨,王 敏 专业(SPECIALITY)=计算机专业,信息专业 SAP关系的导师属性和研究生属性都从PERSON域 中取值 为了避免混淆,必须给这两个属性取不同的属性名 ,而不能直接使用域名 例如定义导师属性名为SUPERVISOR-PERSON( 或SUPERVISOR)研究生属性名为POSTGRADUATE-PERSON( 或POSTGRADUATE) SAP(SUPERVISOR-PERSON, SPECIALITY , POSTGRADUATE-PERSON)关系(续)• 基本关系的性质(续) –③ 列的顺序无所谓•列的次序可以任意交换•遵循这一性质的数据库产品(如ORACLE),增加新属性时,永远是插至最后一列•但也有许多关系数据库产品没有遵循这一 性质,例如FoxPro仍然区分了属性顺序关系(续)• 基本关系的性质(续)–④ 任意两个元组不能完全相同•由笛卡尔积的性质决定•但许多关系数据库产品没有遵循这一性质 。
例如Oracle,FoxPro等都允许关系表中存在两个完全相同的元组,除非用户特别定义了相应的约束 条件关系(续)• 基本关系的性质(续) –⑤ 行的顺序无所谓•行的次序可以任意交换•遵循这一性质的数据库产品(如ORACLE),插入一个元组时永远插至最后一行•但也有许多关系数据库产品没有遵循这一 性质,例如FoxPro仍然区分了元组的顺序关系(续)• 基本关系的性质(续) – ⑥ 分量必须取原子值•每一个分量都必须是不可分的数据项这 是规 范条件中最基本的一条二、 关系模式• 1.什么是关系模式• 2.定义关系模式• 3. 关系模式与关系1.什么是关系模式• 关系模式(Relation Schema)是型,关系是 值 • 关系模式是对关系的描述 –元组集合的结构 •属性构成 •属性来自的域 •属性与域之间的映象关系 –元组语义 –完整性约束条件 –属性间的数据依赖关系集合2.定义关系模式• 关系模式可以形。