数据存储技术

上传人:jiups****uk12 文档编号:57152874 上传时间:2018-10-19 格式:PPT 页数:129 大小:925KB
返回 下载 相关 举报
数据存储技术_第1页
第1页 / 共129页
数据存储技术_第2页
第2页 / 共129页
数据存储技术_第3页
第3页 / 共129页
数据存储技术_第4页
第4页 / 共129页
数据存储技术_第5页
第5页 / 共129页
点击查看更多>>
资源描述

《数据存储技术》由会员分享,可在线阅读,更多相关《数据存储技术(129页珍藏版)》请在金锄头文库上搜索。

1、第3章 数据存储技术,3.1 数据的存储、备份与恢复,随着信息技术尤其是存储技术的发展,数据存储技术与设备也在不断进步,计算机技术与网络技术的发展已经使得各种新型存储技术不断涌现,为计算机信息系统的应用提供了更大的发展空间。同时如何从实际需求出发,综合考虑系统的性价比,设计出最佳的数据存储方案,成为了当前的热门研究方向。本节主要介绍高性能、大容量存储技术。,3.1.1 数据存储,1.数据存储的概念数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要能够反映信息特征的组成含义。数据流反映了系统中流动的数据

2、,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征。总体来说,数据存储包含两方面内容:(1)作为数据临时或长期存储的物理媒介。(2)保证数据安全、完整地存取过程或者方法。,2数据存储的分类 存储的分类方式有很多种。按照存储器的使用方式,分为移动存储和非移动存储。移动存储主要包括U盘、PCMCIA硬盘和移动硬盘等;非移动存储包括内置硬盘、磁盘阵列、磁带机、磁盘库和磁带库等。按其存储原理可以分为:电存储技术,如固态硬盘、闪存等;磁存储技术,如磁带、磁盘等;光存储技术,如光盘、DVD等。光盘的成本最低但是适用性不强,故使用不广泛。磁带的成本适中,多用于大型、超大型数据存储。磁

3、盘的成本最高,存取性能也最好,被广泛使用。,3.1.1 数据存储,3数据分级存储 1)数据分级存储简介根据用户数据的用途和访问频率,存储数据细分为3种类型:访问频率高和访问速度快的数据;访问频率较低,但用户仍要访问的数据;平时根本不用,只是用作长期备份的数据。有统计数字表明,现在用户储存在硬盘上的数据,有近60%平时很少用到。现在的做法是将前两者作为一种类型的数据,全部存储在硬盘中。这种做法虽然对用户的访问应对自如,但硬盘上的很多空间长时间处于等待访问状态。而且在用户需要将容量扩大的情况下,必须有专门的系统管理员对系统重新设置,增加了系统的管理费用而且其升级费用相当可观。应该根据数据的3种分类

4、,合理使用各种存储设备,以求得到最好的投入产出比。具体的方案是:将第一种数据存储在磁盘上,而将第二种数据存储在二级存储设备上,利用它升级方便快捷的特点,不断地扩充新设备给日益增大容量的数据,同时可以腾出更多的硬盘空间给第一种数据。第三种数据显然应该离线存储在二级存储设备上。这就涉及了数据分级存储概念。,3.1.1 数据存储,2)3种存储模式分级存储是根据数据的重要性、访问频率、保留时间、容量、性能等指标,将数据采取不同的存储方式分别存储在不同性能的存储设备上,通过分级存储管理实现数据客体在存储设备之间的自动迁移。数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到较低的

5、存储层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的性价比。这样,一方面可大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能。,3.1.1 数据存储,下面介绍分级存储的3种存储模式。 (1)在线存储。在线存储(onstore)是指将数据存放在高速的磁盘系统(如闪存存储介质、FC磁盘或SCSI磁盘阵列等存储设备)上,适合存储那些需要经常和快速访问的程序和文件,其存取速度快、性能好,存储价格相对昂贵。在线存储是工作级的存储,其最大特征是存储设备和所存储的数据时刻保持“在线”状态,可以随时读取和修改,以满足前端应用服务器或数据库对数据访问的速度要求。,3.1.

6、1 数据存储,(2)近线存储。近线存储(nearstore)是指将数据存放在低速的磁盘系统上,一般是一些存取速度和价格介于高速磁盘与磁带之间的低端磁盘设备。近线存储外延相对比较广泛,主要定位于客户在线存储和离线存储之间的应用。就是指将那些并不是经常用到(如一些长期保存的不常用)的文件归档,或者说访问量并不大的数据存放在性能较低的存储设备上。但对这些设备的要求是寻址迅速、传输率高。因此,近线存储对性能要求相对来说并不高,但又要求相对较好的访问性能。同时,多数情况下由于不常用的数据占总数据量的比重较大,这就要求近线存储设备在容量需求上相对较大。近线存储设备主要有SATA磁盘阵列、DVDRAM光盘塔

7、和光盘库等设备。,3.1.1 数据存储,3.1.1 数据存储,(3)离线存储。离线存储(offstore)是指将数据备份到磁带或磁带库上。大多数情况下,主要用于对在线存储或近线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级存储。离线存储通常采用磁带作为存储介质,它是访问速度低,但价格低廉的海量存储。,3)数据分级存储的优点数据分级存储之所以重要,是因为它既能最大限度地满足用户需求,又可使存储成本最小化。数据分级存储的优点具体表现在: (1)减少总体存储成本。不经常访问的数据驻留在较低成本的存储器中,可综合发挥磁盘驱动器的性能优势与磁带的成本优势。 (2)性能优化。分级存储可使不同

8、性价比的存储设备发挥最大的综合效益。 (3)改善数据可用性。分级存储把很少使用的历史数据迁移到辅助存储器中,或归档到离线存储器中,这样就无须反复保存,减少了存储的时间,同时提高了在线数据的可用性,使磁盘的可用空间维持在系统要求的水平。,3.1.1 数据存储,(4)数据迁移对应用透明。进行分级存储后,数据移动到另外的存储器时,应用程序不需要改变,使数据迁移对应用透明。分级存储设备是可以根据具体应用变化的,这种存储级别的划分是相对的,可以分为多种级别。例如,可以采取FC磁盘SCSI磁盘SATA磁盘这种三级存储结构,也可以采取SSD盘FC磁盘SCSI磁盘SATA磁盘磁带这种五级存储结构,具体采用哪些

9、存储级别需要根据具体应用而定。,3.1.1 数据存储,3.1.1 数据存储,4网络存储解决方案随着网络应用的增强和网络数据量的增大,网络管理中越来越需要一种扩展性更强、存储性能更高的全套解决方案,由此诞生了3种适合不同层次的存储解决方案:直接连接存储、网络附加存储和存储区域网络。下面分别介绍这3种解决方案的特点和存储方式。1)直接连接存储直接连接存储(direct attached storage,DAS)是指将存储设备通过SCSI接口或光纤通道直接连接到服务器上的方式。这种连接方式主要应用于单机或两台主机的集群环境中,主要优点是存储容量扩展的实施简单,投入成本少、见效快。DAS适用于以下几种

10、情况:,3.1.1 数据存储,(1)服务器在地理上分布很分散,通过SAN或NAS在它们之间进行互联非常困难时。 (2)存储系统必须被直接连接到应用服务器上时,如某些数据库使用的“原始分区”。 (3)包括许多数据库应用和应用服务器在内的应用,它们需要直接连接到存储器上时。 当服务器在地理上比较分散,很难通过远程连接进行互联时,或传输速率并不是很高的网络系统,直接连接存储是比较好的解决方案,甚至可能是唯一的解决方案,但是由于DAS没有网络结构,存在许多缺点:一方面该技术不具备共享性,每种客户机类型都需要一个服务器,从而增加了存储管理和维护的难度;另一方面,当存储容量增加时,扩容变得十分困难,而且当

11、服务器发生故障时,数据也难以获取。因此,难以满足现今的存储要求。,3.1.1 数据存储,DAS是一种将存储介质直接安装在服务器上或者服务器外的存储方式。例如,将存储介质连接到服务器的外部SCSI通道上,也可以认为是一种直接连接存储方式。DAS已经存在了很长时间,并且在很多情况下仍然是一种不错的存储选择。由于这种存储方式在磁盘系统和服务器之间具有很高的传输速率,所以虽然在一些部门中一些新的SAN设备已经开始取代DAS,但是在要求快速访问磁盘的情况下,DAS仍然是一种理想的选择。更进一步说,在DAS环境中,运转大多数的应用程序都不会存在问题,所以没有必要担心应用程序问题,从而可以将注意力集中于其他

12、可能会导致问题的领域。,3.1.1 数据存储,2)网络附加存储网络附加存储(network attached storage,NAS)即将存储设备通过标准的网络拓扑结构(如以太网)连接到众多计算机上,提供数据和文件服务。NAS服务器一般由存储硬件、操作系统以及其上的文件系统等几个部分组成。简单地说,NAS是与网络直接连接的磁盘阵列,它具备了磁盘阵列的所有主要特征:高容量、高效能、高可靠性。 NAS由于其较好的可扩展性、可访问性、低价位、安装简单、易于管理等优点,广泛应用于电子出版、CAD、图像、教育、银行、政府、法律等对数据量有较大需求的环境中。多媒体、Internet下载以及在线数据的增长,

13、特别是那些要求存储器能随着文件规模增大而增长的企业、小型公司、大型组织的部门网络,更需要这样一个简单的可扩展的方案。,3.1.1 数据存储,但在实际应用中,NAS也存在着以下不足: (1)在文件访问的速度方面。NAS采用的是File I/O方式,这带来巨大的网络协议开销。正是由于这个原因,NAS不适合对访问速度要求高的应用场合,如数据库应用、在线事务处理。 (2)在数据备份方面。需要占用LAN的带宽,浪费宝贵的网络资源,严重时甚至影响客户应用的顺利进行。 (3)在资源的整合和NAS的管理方面。NAS只能对单个存储(单个NAS内部)设备中的磁盘进行资源的整合,目前还无法跨越不同的NAS设备,难以

14、将多个NAS设备整合成一个统一的存储池,因而难以对多个NAS设备进行统一的集中管理,只能进行单独管理。,3.1.1 数据存储,3)存储区域网络存储区域网络(storage area network,SAN)是指存储设备相互连接且与一台服务器或一个服务器群相连的网络,其中的服务器用SAN的接入点。SAN是一种特殊的高速网络,连接网络服务器和诸如大磁盘阵列或备份磁带库的存储设备,SAN置于LAN之下,而不涉及LAN。利用SAN,不仅可以提供大容量的存储数据,而且地域上可以分散,并缓解了大量数据传输对于局域网的影响。SAN的结构允许任何服务器连接到任何存储阵列,不管数据存放在哪里,服务器都可直接存取

15、所需的数据。,3.1.1 数据存储,SAN的应用主要可以归纳为下面几种: (1)构造群集环境,利用存储区域网可以很方便地通过光纤通道把各种服务器、存储设备连接在一起,构成一个具有高性能、较好的数据可用性、可扩展的群集环境。 (2)异构设备统一成存储池,SAN具有无限的扩展能力,由于SAN采用了网络结构,服务器可以访问存储网络上的任何一个存储设备,因此用户可以自由增加磁盘阵列、磁带库和服务器等设备,使得整个系统的存储空间和处理能力得以按客户需求不断扩大。 (3)传输块级数据,传输块级数据要求必须使用SAN,尤其是多个服务器共同向大型存储设备进行读取时。由于在数据传输时被分成小段,使SAN对服务器

16、处理的依赖较小,可以有效地传送爆发性的块数据,SAN的性能及可靠性得到了充分的发挥。,3.1.1 数据存储,(4)数据保护,存储局域网可以做到无服务器的数据备份,数据也可以后台的方式在存储局域网上传递,大大减少了主要网络和服务器上的负载,所以存储局域网可以很方便地实现诸如磁盘冗余、关键数据备份、远程群集、远程镜像等许多防止数据丢失的数据保护技术。 (5)数据迁移,可以方便地进行两个存储设备之间的数据移动。 (6)灾难恢复,特别是远程的灾难恢复。 (7)数据仓库,用来构建一个网络系统的存储仓库,使得整个存储系统可以很好地共享。,3.1.1 数据存储,在实际应用中,SAN也存在着一些不足: (1)设备的互操作性较差。目前采用最早和最多的SAN互联技术仍是光纤通道技术,对于不同的制造商,光纤通道协议的具体实现是不同的,这在客观上造成不同厂商的产品之间难以互相操作。 (2)构建和维护SAN需要有丰富经验的接受过专门训练的专业人员,这大大增加了构建和维护费用。 (3)在异构环境下的文件共享方面,SAN中存储资源的共享一般指的是不同平台下的存储空间的共享,而非数据文件的共享。 (4)连接距离限制在10 km左右。更为重要的是,目前的存储区域网络采用光纤通道的网络互联设备都非常昂贵。这些都阻碍了SAN技术的普及应用和推广。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号