集群式对象存储

上传人:wt****50 文档编号:49821404 上传时间:2018-08-03 格式:PPT 页数:25 大小:8.48MB
返回 下载 相关 举报
集群式对象存储_第1页
第1页 / 共25页
集群式对象存储_第2页
第2页 / 共25页
集群式对象存储_第3页
第3页 / 共25页
集群式对象存储_第4页
第4页 / 共25页
集群式对象存储_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《集群式对象存储》由会员分享,可在线阅读,更多相关《集群式对象存储(25页珍藏版)》请在金锄头文库上搜索。

1、集群式对象存储传统存储n应用程序只看到Posix接口 (Open, Read, Write ),且 通过Posix接口访问文件n文件系统有两个工作:负责 文件在硬盘上的存储,并负 责向上层的应用程序提供文 件访问服务n硬盘内容= 元数据(目录)+数据(文件内容 )对象存储n应用程序只看到Posix接口 (Open, Read, Write ),且 通过Posix接口访问文件n文件系统(客户端)负责向上层 应用程序提供文件访问服务 ,文件系统(存储管理)负责文 件在硬盘上的存储,即文件 系统(客户端)不关心文件是如 何存储的n文件系统(客户端)和文件系统 (存储管理)通过对象接口交互 。很容易实

2、现网络化的客户- 服务器服务模式n硬盘内容= 元数据(目录)+数据(文件内容 )集群式对象存储n应用程序只看到Posix接口 (Open, Read, Write ),且 通过Posix接口访问文件n文件系统(客户端)负责向上层 应用程序提供文件访问服务n文件系统(存储管理)=文件系 统(元数据管理)+文件系统(数 据管理)n元数据服务器的硬盘内容= 元数据(目录)。元数据服务器 可扩展为多个n对象存储设备的硬盘内容=数 据(文件内容)。对象存储设备 可扩展为多个集群式对象存储n文件是如何在集群式对象存 储上存储的?n对象存储设备,本质上就是 服务器n10台服务器,每一台服务器 有5个硬盘集群

3、式对象存储n文件是按文件块(约为1MB或 4MB)分布在不同服务器的不 同硬盘上n由于任何一个服务器或硬盘 存在失效的可能,所以,每 一个文件有一个或多个副本n注意:文件块的存储策略, 还能基于不同的机架,或不 同的数据中心集群式对象存储n文件A和文件B在集群式对象 存储中的分布n元数据(目录)服务器负责提供 文件系统的目录信息n文件A和文件B的分布情况存 储在元数据(目录)服务器中, 且受元数据服务器的管理集群式对象存储n1、文件系统(客户端)通过元 数据服务器知道文件A在集群 式对象存储上的分布n2、文件系统(客户端)逐次访 问不同的对象存储设备,获 取文件A的内容n每一个服务器(包括硬件

4、和软 件)的健康状态被系统监控n元数据服务器负责文件在对 象存储设备上的存储分布, 以及调整(如 增加、减少、迁 移)集群式对象存储n自动备份n当文件被写入时,元数据服 务器会根据给定的策略,指 示文件块如何被写入n策略包括:1)文件有几个副本 ;2)副本是否存在不同的地方( 如不同的数据中心、不同的 机架、不同的服务器、不同 的硬盘)集群式对象存储n自动恢复n当系统发现一个服务器或服 务器上的一个硬盘失效时, 会指示元数据服务器把该失 效设备上的数据再次备份, 保证文件的可靠性集群式对象存储n自动恢复n当系统发现一个服务器或服 务器上的一个硬盘失效时, 会指示元数据服务器把该失 效设备上的数

5、据再次备份, 保证文件的可靠性。n系统自愈是自动的,不需要 管理员的参与集群式对象存储n高性能n文件是按块从不同服务器的 不同硬盘上访问的- 1)很难有热点效应(动态调整) 2)I/O带宽是聚合的n自动的负载均衡n只需要元数据服务器按一定 的条件调整文件块的分布集群式对象存储n把文件系统的目录信息独立 出来,由元服务器来提供(均 连接到其上),带来以下好处 : 1)统一的名字空间,有利于应 用之间的数据共享 2)在线扩展,有利于系统的扩 展 3)其他的:聚合性能、自动负 载均衡、自动恢复、自动备 份集群式对象存储集群式对象存储n优点 1)海量存储:支持PB级的存储空间,可高效管理上百亿个文件对

6、象,单目录可以有 效支持千万级的文件数量。 2)虚拟化存储:统一的命名空间,所有应用服务器看到一致视图,方便全局文件系 统的部署和扩展,同时确保数据中心内部应用系统的可靠性和容错能力。 3)高性能:具有高效数据读写技术和文件查询技术,能够提供高达几十个GB 的稳 定聚合带宽(并行I/O,直接访问),每秒数十万个的文件查询效率(元服务器是集群) 。 4)高可用:自动故障探测和高效的自动恢复和容错技术,保证系统的高可用特性。结构上-对象服务器+元服务器;数据上-多副本。 5)易扩展:支持在线扩容功能,扩容过程无需中断上层应用的正常运行,同时系统 的总体IO 带宽随着规模的扩大成线性增长。 6)低成

7、本:标准的服务器 7)支持异质结构:无缝集成已有的存储系统 8)自适应的负载均衡:I/O性能和存储分配FC SAN (光纤通道式存储区域网)nSAN 1)SAN,存储区域网络,是一种通过 网络方式连接存储设备和应用服务器 的存储构架,这个网络专用于主机和 存储设备之间的访问。当有数据的存 取需求时,数据可以通过存储区域网 络在服务器和后台存储设备之间高速 传输 2) SAN是存储网络架构,与设备类型 和协议无关:FC SAN和IP SAN 3)SAN是块级的nFC SAN FC协议先于以太网支持千兆带宽,所 以先有FC SANFC SAN (光纤通道式存储区域网)nSAN的优点 1)设备整合。

8、多台服务器可以通过存储网络同时访问后端存储系 统,不必为每台服务器单独购买存储设备,降低存储设备异构化 程度,减轻维护工作量,降低维护费用 2)数据集中。不同应用和服务器的数据实现了物理上的集中,空 间调整和数据复制等工作可以在一台设备上完成,大大提高了存 储资源利用率 3)高扩展性。存储网络架构使得服务器可以方便的接入现有SAN 环境,较好的适应应用变化的需求总结:总体拥有成本低,存储设备的整合和数据集中管理,大大 降低了重复投资率和长期管理维护成本注意:相对于DAS(直连存储)而言FC SAN (光纤通道式存储区域网)nFC SAN的缺点 1)兼容性差。FC协议发展时间短,开发和产品化的大

9、厂商较少,而且厂 商之间各自遵循内部标准,导致不同厂商的FC产品之间兼容性和互操作 差,即使同一厂商的不同版本不同型号的FC产品也存在类似的问题 2)成本高昂。FC SAN的成本包括先期设备成本和长期维护成本,由于FC 协议在成熟度和互联性上无法与以太网相比,导致FC协议只能局限于存 储系统应用,无法实现大规模推广,这直接导致了FC产品价格的昂贵; 同样与FC-SAN相关的所有产品(FC硬盘、备份软件)都身价高昂;另外 兼容性差也导致了用户无法自己维护FC设备,必须购买昂贵的厂商服务 。以5年计算,整个服务费用支出与系统采购达到1:13)扩展能力差。FC-SAN高昂的成本和协议封闭,使得产品的

10、开发、升级 、扩容代价高昂 4)异构化严重。各厂商按照自有标准开发各种功能,如快照、复制、镜 像等,导致不同厂商存储设备之间功能无法互通,结果又出现的DAS方 式的各种问题,重复投资、难以管理的局面IP SAN(基于IP的存储区域网)n特点 将数据块和SCSI指令通过 TCP/IP协议承载(iSCSI),通 过千兆/万兆专用的以太网络 连接应用服务器和存储设备IP SAN(基于IP的存储区域网)nIP SAN优点 1)实现弹性扩展的存储网络,能自适应应用的改变。 2)已经验证的传输设备保证运行的可靠性 3)以太网从1G向10G及更高速过渡,只需通过简单的升级便可得到极大的性能提 升,并保护投资

11、 4)IP跨长距离扩展能力,轻松实现远程数据复制和灾难恢复 5)大量熟悉的网络技术和管理的人才减少培训和人力成本nIP SAN缺点1)存储设备是专用的,必须符合iSCSI标准 - 成本不可控 2)SAN是块级,所以,受本地文件系统的限制,不适合海量文件管理。 3)SAN的高效,不意味着文件系统的高效 - 应用获得的性能问题 4)数据难以共享,服务器和SAN存储是一一绑定的,不同服务器之间的数据共享 很困难 5)兼容性问题,不同SAN厂家的产品的集成问题NAS(网络附加存储)n特点 NAS(网络附加存储),是一种文 件共享服务。拥有自己的文件系 统,通过NFS或CIFS,充当远程 文件服务器,对

12、外提供文件访问 服务。nNAS优点 1)NAS可以即插即用。 2)NAS通过TCP/IP网络连接到应 用服务器,因此可以基于已有的 企业网络方便连接。 3)专用的操作系统支持不同的文 件系统,提供不同操作系统(应 用)间的文件共享。NAS与集群式对象存储的不同不同:在对象存储中元数据和文件数据是独立的,且文件是按文件块存储 在不同的服务器上的NAS(网络附加存储)nNAS缺点 1)集中式存储:适用于某些IO性能要 求不高,并且应用服务器数量较少的 场景 2)性能瓶颈:文件不是分块存储的, 所以,NAS的性能受限于NAS服务器 和IO总线的能力,只能提供数量有限 的客户端并发读写,一旦并发的请求

13、 较多塞满了IO总线,NAS就成为了系 统的瓶颈。 3)难以无缝扩展:NAS的容量和性能都 难以进行无缝扩展。如果要添加容量 或者提高性能,唯一的办法就是另外 购买多套独立的NAS存储系统和相应 的服务器,然后将数据分别存入到不 同的NAS存储系统中。 4)存在单点故障:单台NAS所提供的数 据共享服务存在单点故障,一旦NAS 出现软硬件故障将导致存储服务中断 ,前端的业务也就随着中断对象存储和NAS、SAN的比较n文件系统的元数据是否分离出来,独立于文件数据?nNAS:文件是否以分块的形式存储?nNAS、SAN没有统一的名字空间,不利于应用之间的共享。除非 第三方应用和相应的存储挂接n对象存储很容易实现:在线扩展、聚合性能、自动负载均衡、自 动恢复、自动备份应用领域n大量的非结构化数据的产生 - 高性能、低成本、易扩展/易维 护的文件/存储系统n大环境:现在是一个能方便产生大量数据的时代,现在是一个存 储价格和服务器硬件架构迈向更便宜的时代,现在是一个软件/服 务驱动的时代,现在是一个网络的时代,现在是一个共享/协作的 时代nCDN(内容分发网)-互联网运营商(云计算/云存储)。n纸媒数字化后-庞大数据:银行票据、政府办公。n面向个人的存储:移动系统、第三方存储服务商。n科学计算-大量数据:卫星、石油、天气。n视频:监控、教育、电视台(广电系统)、Web网站。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号