作业管理系统中基于数据感知的调度子系统的设计与实现

上传人:小** 文档编号:47005455 上传时间:2018-06-29 格式:DOCX 页数:78 大小:1.29MB
返回 下载 相关 举报
作业管理系统中基于数据感知的调度子系统的设计与实现_第1页
第1页 / 共78页
作业管理系统中基于数据感知的调度子系统的设计与实现_第2页
第2页 / 共78页
作业管理系统中基于数据感知的调度子系统的设计与实现_第3页
第3页 / 共78页
作业管理系统中基于数据感知的调度子系统的设计与实现_第4页
第4页 / 共78页
作业管理系统中基于数据感知的调度子系统的设计与实现_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《作业管理系统中基于数据感知的调度子系统的设计与实现》由会员分享,可在线阅读,更多相关《作业管理系统中基于数据感知的调度子系统的设计与实现(78页珍藏版)》请在金锄头文库上搜索。

1、硕士学位论文(工程硕士)作业管理系统中基于数据感知的调度子系统 的设计与实现THE DESIGN AND IMPLEMENTATION OFDATA-AWARE-BASED SCHEDULING SUBSYSTEM IN JOB MANAGEMENT SYSTEM李晓婕哈尔滨工业大学哈尔滨工业大学2012 年 6 月国内图书分类号:TP311国际图书分类号:621.3学校代码:10213密级:公开工程硕士学位论文作业管理系统中基于数据感知的调度子系统 的设计与实现硕 士 研 究 生:李晓婕导师:苏小红教授副导师:孙宏伟高级工程师申 请 学 位:工程硕士学科:软件工程所 在 单 位:软件学院答

2、辩 日 期: 2012 年 6 月授予学位单位:哈尔滨工业大学Classified Index: TP311 U.D.C.: 621.3Dissertation for the Masters Degree in EngineeringTHE DESIGN AND IMPLEMENTATION OFDATA-AWARE-BASED SCHEDULING SUBSYSTEM IN JOB MANAGEMENT SYSTEMCandidate:Supervisor:Associate Supervisor:Academic Degree Applied for:Speciality:Affilia

3、tion:Date of Defence:Degree-Conferring-Institution:Li XiaojieProf. Su XiaohongSenior Engineer Sun HongweiMaster of EngineeringSoftware EngineeringSchool of SoftwareJune, 2012Harbin Institute of Technology哈尔滨工业大学工程硕士学位论文摘要由于位于多个物理位置上的多集群环境的出现,和在这种环境下对数据访问 的限制和对数据管理的缺乏,导致了这种环境下缺乏对数据敏感型作业的有效管理。本文所研究的内容

4、是开发能够与 LSF 作业管理系统协作的调度子系统,管理多集群中的数据资源并能够根据集群中的数据资源高效和准确进行作业调度。本论文主要是实现基于数据感知的调度,使作业在提交到系统后,系统能够根据作业需要的数据和系统所掌握的集群中的数据信息来将作业派遣到集群中合适的计算结点上执行。为实现基于数据感知调度,本论文还完成了对集群中数据资源的管理。本论文设计和实现了数据集管理模块、storage 管理模块、缓存管理模块、配置管理模块、数据传输模块、远端数据管理模块和调度模块。在数据集管理模块和 storage 管理模块中,分别实现了对集群中数据集和 storage 的管理功能;在缓存管理模块中,实现了

5、对集群间传输的数据的缓存功能,并维护缓存数据的生命周期;在配置管理模块中,实现了根据用户配置的信息来进行系统信息初始化功能;在数据传输模块中,实现了在集群间传输数据的功能;在远端数据管理模块中,实现了集群与其他集群间共享数据信息的功能;在调度模块中,实现了根据数据信息来制定调度决策的功能。通过以上模块之间的交互,以及系统与作业管理系统的协作,实现了基于数据感知的调度,使数据敏感型作业能够完全靠系统内部的管理和协调而成功运行在计算结点上。通过本系统与 LSF 作业管理系统的协作,用户能够更专注于作业的逻辑而不需关心数据的分布,使得数据敏感型作业的整个周期都能够通过系统内部的协调和计算顺利的执行,

6、而不再需要人工干预的过程,同时还能够为用户提供集群中的数据信息和存储信息。总体来说,实现了针对数据敏感型作业的调度,透明化了用户对数据的操作,提高了作业执行效率,提供了更完善的数据管理功能。关键字:多集群环境;数据感知;作业调度;缓存管理;数据敏感型作业-I-哈尔滨工业大学工程硕士学位论文AbstractAs the appearance of the multi-cluster environment which located in multiple physical locations, and the data access restrictions and lack of data

7、management, Thiscondition leads to a lack of effective management of data sensitive jobs in thisenvironment. This research is to develop a scheduling subsystem which can workswith LSF job management system, to manage data resources in multiple clusterenvironment and support efficient and accurate jo

8、b scheduling.This paper mainly implements data-aware scheduling, ensuring the system candispatch the job to the appropriate computing node according to the data job neededand the data information the system knows after job submitted to the cluster. Toachieve the data-aware-based scheduling, this pap

9、er has also implemented dataresources management in the cluster.This paper designs and implements the dataset management module, the storagemanagement module, the cache management module, the configuration managementmodule, the data transmission module, remote data management module andscheduling mo

10、dule. The dataset management module and storage management moduleimplement the management to the dataset and storage separately. The cachemanagement module implements the cache function for the data transferred betweenthe clusters and maintain the life cycle of the cached data. The configurationmana

11、gement module implements information initialization function based on userprofile configuration. The data transfer module implements the data transfer betweenclusters. The remote data management module implements the data informationsharing between clusters. The schedule module implements making sch

12、edulingdecisions according to the data information. Through the interaction between the abovemodules, as well as the collaboration of the system and job management system,implements data aware scheduling, ensuring the data sensitive jobs can runsuccessfully on the compute host with the systems manag

13、ement and coordination.Through the collaboration of the system and LSF job management system, userscan more focus on the logic of the job without the concern of the distribution of thedata, making the entire lifecycle of data sensitive job is smooth through the computingand management inside the sys

14、tem without users operation, and provide cluster data- II -哈尔滨工业大学工程硕士学位论文and storage information for user. In general, the system implements the scheduling of the data sensitive job, and makes the operation of data transparency, and improves jobrunning efficiency, and provides more complete data management capabilities.Keywords: multi-cluster environment,data-aware,job scheduling,cache management,data sensitive job- III -哈尔滨工业大学工程硕士学位论文目录摘要IAbstract II第 1 章 绪论 11.1 课题背景11.1.1 课题来源 11.1.2 课题研究的目的与意义

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 宣传企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号