griddaen数据网格系统的设计与关键技术实现[1]

上传人:小** 文档编号:89124492 上传时间:2019-05-18 格式:DOC 页数:119 大小:850.50KB
返回 下载 相关 举报
griddaen数据网格系统的设计与关键技术实现[1]_第1页
第1页 / 共119页
griddaen数据网格系统的设计与关键技术实现[1]_第2页
第2页 / 共119页
griddaen数据网格系统的设计与关键技术实现[1]_第3页
第3页 / 共119页
griddaen数据网格系统的设计与关键技术实现[1]_第4页
第4页 / 共119页
griddaen数据网格系统的设计与关键技术实现[1]_第5页
第5页 / 共119页
点击查看更多>>
资源描述

《griddaen数据网格系统的设计与关键技术实现[1]》由会员分享,可在线阅读,更多相关《griddaen数据网格系统的设计与关键技术实现[1](119页珍藏版)》请在金锄头文库上搜索。

1、豆丁文档代下载:http:/ (0.1元/篇)Griddaen数据网格系统的设计与关键技术实现1本文得到国家自然科学基金项目(60203016,69933030)和国家863计划项目(2002AA131010)1肖侬 付伟 黄斌 卢锡城国防科学计算大学计算机学院 410073xiao-摘要:科学计算领域中的科学数据呈现爆炸式增长,未来的科学计算将以数据为中心,数据网格计算技术成为解决复杂海量科学数据的访问和管理的一种有效技术。我们设计和实现的Griddaen数据网格系统,可以管理多个分布异构的存储资源的数据,为用户提供统一的数据访问。本文重点介绍了我们设计的数据网格系统体系结构,以及系统的设计

2、原则和目标,并讨论了系统主要关键技术的实现。关键字 网格、Griddaen,数据网格,GridOppenKeywords: Grid Computing, Griddaen, DataGrid, GridOppen1. 1.前言由于技术的发展,现代大型科学工程研究、信息服务和数字媒体应用中的数据呈爆炸式增长,应用数据从几十个Terabyte到Petabyte,而且还在持续高速的增长,数据已经成为一个重要的资源,例如:全球气候模拟、高能物理、生物计算、战场仿真、核模拟,数字地球、电子商务、电子政务、数字媒体等应用,它们的数据量将达到几十个TeraByte至PetaByte的级别,地理上广泛分布的

3、用户都希望能够访问、分析和使用这些庞大的分布数据,而他们的分析方法往往是计算复杂和计算量大,这种结合海量数据集合、地理上分布的用户和资源,以及计算密集型的分析处理应用导致了现有的数据管理体系结构、方法和技术已经不能满足高性能、大容量分布存储和分布处理能力的要求,如何存储、分发、组织和管理、高性能处理、分析和挖掘海量分布数据成为许多应用的首要问题。数据网格技术1的发展为解决这个问题提供了一条有效的技术途径,它通过开发能够集成网络上分布的多个数据集等资源,形成单一虚拟的数据访问、管理和处理环境,为用户屏蔽底层异构的物理资源,建立分布海量数据的一体化数据访问、存储、传输、管理与服务架构。Gridda

4、en 是我们设计和实现的Gridoppen网格系统中支持数据网格功能的系统部分,它集成各种数据文件存储系统,提供一个分布数据的统一无缝访问方式。Griddaen 采用分布多域联邦服务器和高可用技术,支持虚拟文件集合和数据集合,支持系统的数据副本和Cache机制,以提高分布异构存储系统数据的访问性能。文章第二部分介绍数据网格发展现状和相关工作,第三部分介绍Griddaen 数据网格系统的结构和框架,第四部分给出其主要设计策略和关键技术实现,第五部分给出系统的应用实例和使用界面,在最后对各个数据网格项目的分析和比较,并描述了系统的状态和将来的工作。2. 2.相关工作数据网格系统技术的发展非常迅速,

5、对科学数据的访问和管理成为众多项目的研究目标。欧洲数据网格2的目标是以欧洲粒子中心(CERN)从Terabyte到Petabyte规模数据为中心,为世界范围内分布的科研团体提供的数据分布存储、传输和计算密集型分析处理的能力,以进行科学研究,开展面向高能物理学、地球观测、生物信息学等应用的研究工作,研究内容主要包括:数据访问、数据副本管理、元数据管理、数据安全、查询优化、资源调度和管理等,采用Globus、面向对象数据库、网格数据库服务系统等技术,构建一个包括软硬件的网格环境。SpitFire3是其数据库访问接口ODBC的Grid service的实现,OGSA-DAI正在讨论网格和数据库系统,

6、特别是联邦数据库系统技术的结合。美国GriPhyN4系统提出应用虚拟数据的概念和语言,描述如何通过计算获得并使用派生信息和数据,这是为系统访问远程数据还是通过计算获得,或者获取他人计算处理过程符合自己需求的数据等情况提供决策依据,为数据的自动生成和再生成提供较完整的系统方法。SDSC的SRB5提高了一套在分布环境下统一访问异构存储系统上的数据的中间件系统,包括文件系统、数据库、文档系统等,为上层应用/用户提供透明的数据服务,SRB采用了集中式的元数据目录MCAT服务广域的数据访问和管理,最初并不支持网格环境下使用,为了支持数据网格的特点,已经进行了改进,正在进行分布设计和实现,对多域管理环境进

7、行支持,主要以对文件的访问为主。Punch Virtual File System(PVFS)6采用代理机制接受NFS Client的请求,经过处理分析,访问NFS系统的服务端数据,实现了多个NFS系统的数据统一访问。Globus7系统使用了标准的协议实现了文件数据的移动和远程访问GASS7和数据的高速传输Gridftp8基本机制,在此基础上实现数据复制元数据目录的管理和复制的选择,为数据网格系统提供了一个较好的底层系统开发平台。Avaki9数据网格系统采用了面向对象的方式实现对多个域环境下的NFS文件系统的数据进行访问,提供了统一的安全认证,支持数据复制管理。Griddaen 和SRB系统、

8、Avaki的数据网格系统的目标基本一致,实现了系统的全局命名、统一文件数据访问、单一登录等,系统元数据采用多层次分布结构和独立服务机制,可以较灵活的配置,整个系统采用分布联邦多域服务器技术和请求优化技术,具有可扩展性和高可用性,采用复制和Cache机制最大限度减少用户访问数据所需的性能开销,采用了基于角色和多层次别访问控制,实现系统的全局管理。3. 3.Griddaen系统结构和设计Griddaen 数据网格能够集成广域网环境下异构的各种存储资源,例如Linux、Windows等单机文件系统、NFS等网络文件系统以及数据库系统等,并将它们统一组织起来,通过系统提供的数据访问和管理服务屏蔽底层存

9、储资源异构性和多个管理域,为用户提供直观、一体化的文件视图和方便、规范的访问和操作方法。系统的服务逻辑功能如图1所示:Griddaen 数据网格作为系统中间件,是一个三层结构,第一层是各种面向具体存储资源的访问接口,直接面向底层的数据存储资源和元信息资源,包括各种文件系统和数据库系统,采用各个存储系统支持的访问和驱动协议和方法访问和使用这些系统中的数据;第二层是数据网格系统管理多个数据源进行统一访问管理提供的各种核心服务,主要包括资源聚合器、数据服务、元数据服务、安全和系统管理;第三层是数据网格面向用户提供的数据服务使用界面和接口。其核心是第二层的服务层。资源聚合器主要面向计算、设备等资源的接

10、入、监控和调度管理,支持计算网格所需功能,这里不重点描述;数据服务模块主要提供数据的访问优化、调度和服务,管理分布异构存储资源上的数据为一体,提供数据的统一访问,允许数据的高速传送、复制操作和副本管理,以及虚拟数据管理;元数据服务为系统提供全局资源的信息服务,提供数据的定位和属性查找,数据的注册和发布,系统资源信息的查询和维护,安全和授权信息和用户元信息的访问和管理,副本信息的管理和选择,为用户和系统提供一个元信息的访问接口和访问协议。安全服务主要支持单一登录认证和多层次的访问控制和授权机制。系统管理主要实现网格系统用户的建立和删除,系统的配置和部署,以及全网格系统状态的监控。Griddaen

11、主要由DRB服务和元数据服务器MDS等组成,见图2。DRB(data Request Broker)服务为用户提供数据访问、存储和管理的功能,它采用分布式结构设计,每一个SITE管理域有一个DRB服务器独立地提供数据访问服务,当用户请求时,DRB Master产生DRB Proxy为用户提供各种数据操作服务。分布的DRB之间可以协同工作联合提供数据服务。DRB对用户的应用请求进行分析并调度到合适的存储资源,启动相应存储点的DRB进行数据服务,为用户提供数据操作和管理服务,DRB获取数据以后,采用高速的数据传输协议直接向客户端发送数据, MDS(MetaData Server)元数据服务器是一个

12、层次式分布服务结构,由局部元信息服务器和中央全局元信息服务器组成,各个局部元数据服务器负责所对应本地的资源和数据元信息服务,提供元信息服务的访问,中央服务器建立各个局部元信息的索引和数据缓冲,为DRB实现统一的访问接口和全局数据视图提供元信息支持。MDS和DRB是相互独立设计和实现的,通过系统的部署和配置建立服务关系。Unix, NTDB2, Oracle, HPSS, UniTree, DMF 存储资源DB2, Oracle, Sybase, SQLServer安全服务认证授权用户映射计费元数据服务数据元信息访问与管理用户管理系统信息访问与管理数据服务访问分发远程数据访问数据传输与操作数据缓

13、冲复制系统管理系统配置管理系统监控统一操作接口和全局操作视图文档系统访问接口文件系统访问接口数据库访问接口元信息访问接口客户副本管理与选择资源和数据代理计算资源聚合器资源信息服务联合调度分配资源访问接口资源描述接入数据注册发布管理Unix, NTDB2, Oracle, HPSS, UniTree, DMF 存储资源DB2, Oracle, Sybase, SQLServer安全服务认证授权用户映射计费元数据服务数据元信息访问与管理用户管理系统信息访问与管理数据服务访问分发远程数据访问数据传输与操作数据缓冲复制系统管理系统配置管理系统监控统一操作接口和全局操作视图文档系统访问接口文件系统访问接口数据库访问接口元信息访问接口客户副本管理与选择资源和数据代理计算资源聚合器资源信

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号