UIT存储基础培训课件

上传人:公**** 文档编号:569344225 上传时间:2024-07-28 格式:PPT 页数:46 大小:2.32MB
返回 下载 相关 举报
UIT存储基础培训课件_第1页
第1页 / 共46页
UIT存储基础培训课件_第2页
第2页 / 共46页
UIT存储基础培训课件_第3页
第3页 / 共46页
UIT存储基础培训课件_第4页
第4页 / 共46页
UIT存储基础培训课件_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《UIT存储基础培训课件》由会员分享,可在线阅读,更多相关《UIT存储基础培训课件(46页珍藏版)》请在金锄头文库上搜索。

1、United Information Technology Co., Ltd.UIT存储基础存储基础技术中心郭镭技术中心郭镭United Information Technology Co., Ltd.第二章第二章 操作系统与存储操作系统与存储块设备文件系统卷管理技术数据库与存储United Information Technology Co., Ltd.操作系统与存储操作系统与存储United Information Technology Co., Ltd.设备分类设备分类 - 字符设备与块设备字符设备与块设备字符设备(Characterdevices)指那些无须缓冲直接读写的设备。字符设备

2、以字节为单位进行读写,数据缓冲系统对它们的访问不提供缓冲。裸设备,也叫裸分区(原始分区),是一种没有经过格式化,不通过文件系统来读取的特殊字符设备块设备(Blockdevices)只能以块为单位进行读写,典型的块大小为512或1024字节。块设备允许随机访问,每次读写的数据量都是数据块长度的整数倍。块设备和字符设备的区别在概念上主要是字符设备跳过了缓冲区,块设备则要经过缓冲区。硬盘是既可以做块设备用,也可以做字符设备用。United Information Technology Co., Ltd.块设备和块块设备和块I/OSector块设备传输数据的最小单位Block文件系统的最小存储单位Se

3、gment内存交换单位或一部分Page磁盘缓存单位PageBlockSectorBlockI/OUnited Information Technology Co., Ltd.Sector硬件设备存放数据的连续区域单位.一个sector的大小是512字节sector是磁盘设备和操作系统之间最小传输单位,多个sector可同时传输。如果磁盘设备支持的sector大小是512的整数倍且大于512字节,那么操作系统的底层block驱动程序帮我们自动转化。United Information Technology Co., Ltd.sector是操作系统和块硬件设备之间传送数据的单位,那么block是文

4、件系统管理数据的单位比如操作系统的虚拟文件系统VFS需要从硬件设备上读取一个block,实际上是从硬件设备读取了一个或多个sector.对于文件管理来说,每个文件对应的多个block可能是不连续的block最终要映射到sector上,所以一般block的大小是sector大小的整数倍不同的文件系统,可以使用的block的大小可以不同块块 BlockUnited Information Technology Co., Ltd.块设备操作的基本概念块设备操作的基本概念对block设备的操作涉及到的内核组件ThegenericblocklayerThegenericblocklayer隐藏硬件细节,

5、提供block设备的抽象视图。提供通用的数据结构描述disks和diskpartitions.I/OschedulerI/Oscheduler(I/O调度器)根据内核制定的策略对未决的(pending)I/O数据传送请求进行排序和调度。提高I/O调度器的效率也是影响整个系统对块设备上数据管理效率的一个方面。blockdevice最后,blockdevice设备驱动程序,完成和硬件的具体交互。United Information Technology Co., Ltd.为什么需要为什么需要I/O调度?调度?磁盘寻道在计算机系统中是最慢的操作没有合适的I/O调度器,对系统性能影响非常大I/O调度可

6、以安排磁头在一个方向上移动,减少seek次数像电梯(操作系统中一般称这样的算法为电梯算法)在全局范围内获得高吞吐量blockI/OrequestI/OSchedulerRequestqueuemaintenanceRequestdispatchI/OScheduler的工作SortrequestqueuesMergerequestqueuesDispatchI/Orequests提高读取磁盘的效率United Information Technology Co., Ltd.逻辑卷管理逻辑卷管理传统分区缺点:磁盘的划分通过分区来实现,在系统安装之前用户必须正确选择每个分区的大小分区大小是固定不变

7、的,同时也就限制文件系统和文件的大小分配给分区的磁盘空间必须是连续,这个特点限制了分区不能跨越多个物理卷LVM逻辑卷管理优点:可分配非连续空间,可以跨越多个硬盘可以动态增大逻辑卷的大小方便存储管理操作,包括文件系统的备份、分区的删除、新分区的建立和文件系统的恢复等新的硬盘很容易动态地添加到系统DriversVG操作系统物理存储LogicalVolumeManager(LVM)LVLV数据库文件系统VGLV文件系统United Information Technology Co., Ltd.卷组卷组VG :Volume Grouphdisk0hdisk0hdisk1hdisk1hdisk2hdi

8、sk2rootvgrootvgdatavgdatavg一个卷组VG可以拥有多个硬盘,但至少拥有一个硬盘(hdisk)一个硬盘(hdisk)只能属于一个VG,不能同时属于多个不同VG用户可以创建多个不同VG,rootvg是操作系统所在的VGUnited Information Technology Co., Ltd.物理卷物理卷PV和和PP存储管理器中,一个硬盘就是一个PV一个PV要划分为大小相等的PP同一个VG中的不同PV的PP大小要一样,默认的PP大小为4MPV必须加入一个VG中,系统才能使用其存储空间hdisk(hdisk(硬盘硬盘硬盘硬盘) )PVPVPPPPPhysicalVolume

9、(物理卷)PhysicalPartition(物理分区)United Information Technology Co., Ltd.逻辑卷逻辑卷LV1 12 23 34 45 59 96 67 78 81010 111112121 12 23 34 45 59 96 67 78 81010 11111212PVPVPVPVLVLV逻辑卷逻辑卷逻辑卷逻辑卷(LogicalVolume)映射关系映射关系映射关系映射关系1 12 23 34 45 56 67 78 8 n n存储管理一个很重要的特点就是引入了“逻辑卷”这个概念,几乎所有的存储管理都围绕“逻辑卷”展开逻辑卷LV有多个逻辑上连续的逻辑

10、分区LP组成,逻辑分区与物理分区存在映射关系,他们大小一样VGVGLogicalPartition 逻辑分区创建了逻辑卷后,可以在上面创建文件系统,还可以直接是裸设备,用于数据库软件的数据存取等逻辑卷空间不足,只要卷组中还有足够的PP数量,那么逻辑卷空间都可以动态增大LVLV逻辑卷的意义逻辑卷的意义逻辑卷的意义逻辑卷的意义United Information Technology Co., Ltd.逻辑卷逻辑卷LV与文件系统与文件系统hd4hd4LVLVhd1hd1limhailimhaihomehome(root)(root)LVLVhd2hd2binbinusrusrlpplpplibli

11、bhd9varhd9varspoolspoolvarvaretcetcmntmnt逻辑卷管理器:扮演的角色就是管理好逻辑卷与物理卷之间的映射关系,保证所有的上层存储操作命令都正确地把数据写入相应的物理设备中文件系统:是数据存储方式。它扮演的角色就是以清晰层次结构的文件和目录,去管理好用户数据存取,保证用户写入的数据以可靠的存储方式存放,且无差错地响应用户请求的数据不同文件系统的数据存在硬盘的不同逻辑卷中United Information Technology Co., Ltd.逻辑卷管理器逻辑卷管理器rootvgPVPV文件系统文件系统LVhd1hd6hd8lv00paging00Mount

12、Mount表表jfspagespacejfslogjfspagespacePPhomelimhai类型varlimhaioracleoracleApp-dataMount点datatvg逻辑卷逻辑卷LV与文件系统与文件系统 结构图结构图United Information Technology Co., Ltd.逻辑卷策略逻辑卷策略 - 镜像镜像mirrorPP1PP1PP2PP2PP1PP1PP2PP2PP1PP1PP2PP2LP1LP1LP2LP2. . .hdisk0hdisk0hdisk1hdisk1hdisk2hdisk2LV00LV00镜像mirror,类似于RAID1,可以实现逻

13、辑卷中逻辑分区的镜像,在独立的不同硬盘中保存两个或三个副本,从而保证硬盘出错时数据不受损坏而且是可用的镜像的调度策略Parallel(并行):每个副本的写请求是同时进行的,当更新时间最长的副本完成后,控制就返回给程序。执行效率很高,但当副本更新时若有硬盘错误发生,数据的完整性有可能遭到破坏。读操作时候,读最相近的副本,所以响应速率快Sequential(串行):当数据写到逻辑分区时,只有所有的副本都更新后控制才返回给程序,而且副本是一个个轮留更新。执行速率比并行镜像慢,但是数据完整性较好。读操作时候,总是先读主副本United Information Technology Co., Ltd.逻

14、辑卷策略逻辑卷策略 -条带化条带化striping1 12 23 34 45 56 67 78 89 91010 111112121313 141415151616 171718181 14 47 71010 131316162 25 58 81111 141417173 36 69 91212 151518181 1、没有做条带化的数据块流:、没有做条带化的数据块流:、没有做条带化的数据块流:、没有做条带化的数据块流:2 2、做了条带化的数据块流:、做了条带化的数据块流:、做了条带化的数据块流:、做了条带化的数据块流:PVPVPVPV做条带化类似于RAID0条带化把数据块均匀地分布在不同硬盘

15、上访问逻辑卷上的连续数据时多个硬盘驱动器并行操作,提高了I/O的吞吐量United Information Technology Co., Ltd.物理卷内分配策略物理卷内分配策略外部边缘外部边缘外部边缘外部边缘外部中间外部中间外部中间外部中间中心中心中心中心内部中间内部中间内部中间内部中间内部边缘内部边缘内部边缘内部边缘硬盘的平面图硬盘的平面图硬盘的平面图硬盘的平面图通常访问最频繁的LV分配在中心,访问不频繁的LV分配在边缘访问速度访问速度访问速度访问速度慢慢慢慢慢慢慢慢快快快快United Information Technology Co., Ltd.文件系统文件系统 File Syst

16、em 概念:文件和对文件进行操纵和管理的软件集合。三个层次一、管理的对象及属性(1)文件(2)目录(3)物理存贮空间的管理二、管理的文件操作:(1)逻辑文件系统:受命write-write(2)基本I/O管理:write(3)基本文件系统:向driver发令(4)I/O控制层:driver三、管理的文件系统接口(1)命令接口:(2)程序接口:United Information Technology Co., Ltd.文件系统层次模型文件系统层次模型United Information Technology Co., Ltd.File System Driver体系结构(本地)体系结构(本地)

17、United Information Technology Co., Ltd.File System Driver体系结构(远程)体系结构(远程)United Information Technology Co., Ltd.存储分配方法(文件物理组织)存储分配方法(文件物理组织) 连续分配(磁带,磁盘都可采用)每个顺序文件分配一组相邻盘块。特点:简单(1)顺序访问容易且速度快,因磁头移动距离小,(2)要求连续空间,一段时间后需整理磁盘以消除外部碎片。(3)必须事先知道长度,文件不易动态增长和删除。链接分配文件离散地分配于各盘块中,以提高外存利用率,文件长度可变,易于增删,只能顺序存取。特点:只

18、适合于顺序访问,对随机访问效率低,可靠性差。链接分配问题:不能高效直接存取;FAT需占较大的内存。索引分配概念:为每个文件分配一个索引块特点:(1)文件较大时有利。文件较小时浪费外存空间(还需为小文件建索引块)(2)当文件较大时,索引块太多,则需建立多级索引United Information Technology Co., Ltd.日志文件系统日志文件系统日志文件系统最大的优点在于提供了更好的安全性。日志文件系统会将整个磁盘所做过的更动,像写日记一样完整的记录下来,一旦发生非预期的故障状况,会在下次启动时,自动检查已记录的日志,然后依照日志记录的动作再做一次,将系统恢复到当机前的正常状态。可

19、以大幅减少不正常关机后所花费的系统修复时间,让数据的使用更有效率非日志文件系统发生故障时,需要辛苦地执行FSCK命令检查与修复整个文件系统。现在动辄数十GB的磁盘空间,一旦不正常关机,便要耗费相当多的时间来检查及修复文件系统,且不能百分之百保证所有的数据都不会流失United Information Technology Co., Ltd.每个文件系统由逻辑块的序列组成,一个逻辑盘空间一般划分为几个用途各不相同的部分,即引导块、超级块、inode区以及数据区等。引导块:在文件系统的开头,通常为一个扇区,其中存放引导程序,用于读入并启动操作系统;超级块:用于记录文件系统的管理信息。特定的文件系统

20、定义了特定的超级块;inode区(索引节点):一个文件或目录占据一个索引节点。第一个索引节点是该文件系统的根节点。利用根节点,可以把一个文件系统挂在另一个文件系统的非叶节点上;数据区:用于存放文件数据或者管理数据。Unix/Linux文件系统文件系统逻辑块数量的决定:建立文件系统时,可以自行设定逻辑块的大小是1024、2048或4096Bytes若沒有指定,则系统默认为4096Bytes每个分区的逻辑块数量由以下公式确定:United Information Technology Co., Ltd.Unix/Linux文件系统结构文件系统结构United Information Technol

21、ogy Co., Ltd.超级块中包含了描述文件系统基本尺寸和形态的信息。文件系统管理器利用它们来使用和维护文件系统。通常安装文件系统时只读取数据块组0中的超级块,但是为了防止文件系统被破坏,每个数据块组都包含了复制拷贝。超级块包含如下信息:BlockGroupNumber:超级块的拷贝。BlockSize:以字节记数的文件系统块大小如1024字节。BlocksperGroup:每个组中块数目,当文件系统创建时此块大小被固定下来。FreeBlocks:文件系统中空闲块数FreeInodes:文件系统中空闲Inode数FirstInode:文件系统中第一个inode号。根文件系统中第一个inod

22、e将是指向/目录的目录入口。超级块超级块PartitionPartitionPartitionFileSysteminode inode inode inode inodei-listdirectoryblocksanddatablocksBootBlockSuperBlockUnited Information Technology Co., Ltd.文件系统通过一个inode结构来描述文件系统中文件并确定此文件系统的拓扑结构。同时还有一个位图被系统用来跟踪已分配和未分配的inode。inode结构描述文件中数据占据哪个块以及文件的存取权限、文件修改时间及文件类型。文件系统中的每个文件用一个

23、inode来表示且每个inode有唯一的编号。目录是一个包含指向其目录入口指针的特殊文件(也用inode表示)。inode包含以下几个域:mode:它包含两类信息:inode描述的内容以及用户使用权限。inode可以表示一个文件、目录、符号连接、块设备、字符设备或FIFO。OwnerInformation:表示此文件或目录所有者的用户和组标志符。文件系统根据它可以进行正确的存取。Size:以字节计算的文件尺寸。Timestamps:inode创建及最后一次被修改的时间。Datablocks:指向此inode描述的包含数据的块指针。inode数量=FileSystem_size/NBPI(Num

24、berofBytesperinode)在文件系统创建以后就不能修改了,想增加inode数,只能增加文件系统的大小。Bytes-per-inode最小不能小于blocksize,因此指定Bytes-per-inode大小等于blocksize大小可以获得最大inode个数。inodeUnited Information Technology Co., Ltd.inode 的数量的数量执行df-i命令可查看inode的数量:United Information Technology Co., Ltd.inode 文件结构文件结构inode中存放的指针,会指到实际存放文件的数据块小的文件仅需用到in

25、ode中directblocks的空间若再大文件则会用到indirectblocks、doubleindirectblocks或tripleindirectblocks块指针指向间接数据块,间接数据块再指向实际的文件数据块。较大文件的inode指向更多的间接数据块。United Information Technology Co., Ltd.NTFS文件系统文件系统什么是NTFS新(N)技术(T)文件(F)系统(S)?NTFS新特性主文件表(MasterFileTable)。而$MFT则由文件记录(FileRecord)数组构成。FileRecord的大小一般是固定的,通常情况下均为1KB,这

26、个概念相当于Linux中的inode。$MFT仅供FileSystem本身组织、架构文件系统使用,这在NTFS中称为元数据(Metadata)。NTFS存储结构卷,簇主控文件表文件引用号,文件记录,文件名称常驻属性与非常驻属性索引数据压缩United Information Technology Co., Ltd.NTFS存储结构:卷存储结构:卷卷是建立在磁盘分区上一个磁盘可以有多个卷,一个卷也可以有多个磁盘组成经过格式化的卷上的数据可分为:元数据和用户数据United Information Technology Co., Ltd.NTFS存储结构:簇存储结构:簇簇作为磁盘空间分配和回收的基

27、本单位簇的大小是用户在使用Format命令或其他的格式化程序格式化卷时确定的。簇随卷的大小而不同,但都是物理扇区的整数倍,通常是2的幂。系统默认NTFS簇的大小不会超过4KB,簇越小空间的利用率就越好。NTFS使用LCN(LogicalClusterNumber,逻辑簇号)和VCN(VirtualClusterNumber,虚拟簇号)来进行簇的定位。分区大小每簇的扇区缺省的簇大小=2G84KBUnited Information Technology Co., Ltd.VCN和和LCNNTFS使用逻辑簇号(LogicalClusterNumber,LCN)和虚拟簇号(VirtualCluste

28、rNumber,VCN)来对簇进行定位。LCN是对整个卷中所有的簇从头到尾所进行的简单编号。用卷簇乘以LCN,NTFS就能够得到卷上的物理字节偏移量,从而得到物理磁盘地址。VCN则是对属于特定文件的簇从头到尾进行编号,以便于引用文件中的数据。VCN可以映射成LCN,而不必要求在物理上连续。United Information Technology Co., Ltd.NTFS存储结构:主控文件表存储结构:主控文件表MFT(MasterFileTable,主控文件表)是NTFS卷结构的核心,是NTFS中最重要的系统文件,包含了卷中所有文件的信息。MFT是一个数据库,由一系列文件记录Filereco

29、rd组成。卷中每一个文件都有一个文件记录,每个文件记录的大小都固定为1KB。卷上的每个文件(包括MFT本身)都有一行MFT记录。MFT开始的16个元数据文件是保留的。在NTFS中只有这16个元数据文件占有固定的位置。每个这样的元数据文件都有一个以“$”开头的文件名称,不过该符号是隐藏的。16个元数据文件之后则是普通的用户文件和目录。United Information Technology Co., Ltd.NTFS中的中的16个元数据文件个元数据文件0:$Mft:MFT本身,保存NTFS卷中所有文件的记录1:$MftMirr:MFT镜像,Mft一小部分的副本2:$LogFile:日志文件,N

30、TFS卷结构和元数据更改日志,用来保证数据一致性3:$Volume:卷文件,保存NTFS卷的基本信息(如NTFS版本等)4:$AttrDef:属性定义表,定义NTFS支持的文件属性5:$:根目录6:$Bitmap:位图文件,卷的cluster位图7:$Boot:引导文件,引导区8:$BadClus:坏簇文件,坏扇区标记9:$Secure:安全文件,权限信息10:$UpCase:大写文件,大小写对应表11:$Extendedmetadatadirectory:扩展元数据目录$Quota磁盘配额信息$ObjID文件的ObjID$UsnJrnl用户使用信息$Reparse重分析点12,13,14,1

31、5:预留15:其他用户文件和目录United Information Technology Co., Ltd.NTFS存储结构:主控文件表的空间和备份存储结构:主控文件表的空间和备份NTFS把磁盘分成了两大部分,其中大约12%分配给了MFT,以满足其不断增长的文件数量。为了保持MFT元文件的连续性,MFT对这12%的空间享有独占权。余下的88%的空间被分配用来存储文件。MFT空间的使用机制可以这样来描述:当文件耗尽了存储空间时,Windows操作系统会简单地减少MFT空间,并把它分配给文件存储。当有剩余空间时,这些空间又会重新被划分给MFT。United Information Technol

32、ogy Co., Ltd.NTFS设计目标:可恢复性设计目标:可恢复性文件系统的要求:速度快和可恢复性速度快=读写操作快=使用缓存=可恢复性降低文件系统的可恢复性取决于文件系统的写入操作方式。谨慎写(carefulwrite)文件系统:例如FAT文件系统的“写通”技术。速度性能差延迟写(lazy-write)文件系统:例如UNIX文件系统的“写回”高速缓存技术。可恢复性差事务日志(transactionlog)文件系统:试图既超越谨慎写文件系统的安全性,也达到延迟写文件系统的速度性能。United Information Technology Co., Ltd.NTFS的恢复机制的恢复机制Th

33、e Change Journal File 采用Logging来保护FS的结构安全NTFS通过日志记录(logging)来实现文件系统的可恢复性。所有改变文件系统的子操作在磁盘上运行以前,首先被记录在日志文件中。在系统崩溃后的恢复阶段,NTFS根据记录在日志文件中的文件操作信息,对那些部分完成的事务进行重做或是撤销,从而保证了磁盘上文件系统的一致性。日志记录的实现可恢复性的实现United Information Technology Co., Ltd.数据库与存储数据库与存储 - 使用裸设备使用裸设备因为使用裸设备避免了再经过操作系统这一层,数据直接从DBMS到Disk进行传输,所以使用裸设

34、备对于读写频繁的数据库应用来说,可以极大地提高数据库系统的性能。使用的是原始分区,没有采用文件系统的管理方式,对于Unix维护文件系统的开销也都没有了,比如不用再维护inode,空闲块等,这也能够导致性能的提高一般数据库厂商会建议使用裸设备(字符设备),空间管理完全由数据库引擎进行管理,这样所有数据和日志直接写盘,当发生系统故障时,安全性较强,不至于丢失数据。United Information Technology Co., Ltd.数据库自动存储管理数据库自动存储管理OracleASMUnited Information Technology Co., Ltd.数据库不依赖于数据库不依赖于

35、OS的文件系统和卷管理的文件系统和卷管理United Information Technology Co., Ltd.数据库文件的地址映射数据库文件的地址映射United Information Technology Co., Ltd.数据库自动存储管理的意义数据库自动存储管理的意义不需要操作系统的映射与缓存,提高效率在多个磁盘上自动分散空间使用和I/O负载不需要手动进行存储配置优化可以在线进行存储配置United Information Technology Co., Ltd.谢谢谢谢United Information Technology Co., Ltd.(.)成立于2004年,专注于企业管理培训。提供60万企业管理资料下载,详情查看:http:/

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号