首页> 中文学位 >网格计算系统中短作业调度模块的设计与实现
【6h】

网格计算系统中短作业调度模块的设计与实现

代理获取

目录

网格计算系统中短作业调度模块的设计与实现

THE DESIGN AND IMPLEMENTATION OF SCHEDULING MODULE OF SHORT JOBS IN GRID

摘 要

Abstract

目 录

第1章 绪论

1.1 课题的背景及研究目的

1.1.1 课题来源及背景

1.1.2 研究目的

1.2 与本课题相关的国内外研究综述

1.2.1 网格技术及其发展现状

1.2.2 分布式计算技术国外研究状况

1.2.3 分布式计算技术国内研究状况

1.3 本论文的主要工作内容

1.4 本文组织结构

第2章 短作业调度模块的需求分析

2.1 短作业调度模块背景产品分析

2.1.1 集群结构

2.1.2 系统LSF中的进程调度

2.2 短作业调度需求的提出

2.2.1 短作业调度模块需求的提出

2.2.2 短作业调度的设计思路

2.2.3 短作业调度模块的框架

2.3 功能需求

2.3.1 和系统之间整合

2.3.2 调度策略

2.3.3 容错处理和日志记录

2.4 非功能需求

2.4.1 高效性

2.4.2 可靠性

2.4.3 其他非功能约束

2.5 技术难点

2.5.1 短作业调度优化的问题

2.5.2 并行作业控制的问题

2.5.3 容错处理的问题

2.5.4 资源收集分配和控制的问题

2.6 本章小结

第3章 短作业调度模块的设计

3.1 模块功能及结构设计

3.1.1 模块总体结构设计

3.1.2 模块结构设计

3.1.3 子模块划分设计

3.1.4 交互设计

3.2 短作业调度主模块的设计

3.2.1 初始化会话环境

3.2.2 进程产生与递交作业

3.2.3 获取作业运行结果

3.2.4 夊原会话

3.2.5 进程间的信号通信

3.2.6 检查点机制恢夊任务

3.3 短作业调度子模块的设计

3.3.1 会话指挥器子模块的设计

3.3.2 会话调度器子模块的设计

3.3.3 动态库子模块的设计

3.3.4 会话实体管理器子模块的设计

3.3.5 会话朊务子模块的设计

3.3.6 会话子实体子模块的设计

3.4 错误消息日志的设计

3.5 数据结构设计

3.5.1 作业信息描述的结构体设计

3.5.2 作业执行回执描述的结构体设计

3.5.3 任务文件的文件格式设计

3.6 本章小结

第4章 短作业调度模块的实现

4.1 短作业调度主模块的实现

4.1.1 初始化会话环境

4.1.2 递交作业的实现

4.1.3 获取作业运行结果的实现

4.1.4 夊原会话和信号处理的实现

4.1.5 检查点恢夊的实现

4.2 短作业调度子模块的实现

4.2.1 会话指挥器和会话调度器的实现

4.2.2 会话实体管理子模块的实现

4.2.3 会话朊务子模块的实现

4.2.4 会话子实体子模块的实现

4.3 模块间交互的实现

4.3.1 建立会话时进程的启动关系

4.3.2 作业派发时进程间的交互关系

4.3.3 任务结束时进程退出的流程

4.3.4 主模块异常退出时进程退出的流程

4.3.5 代理节点启动时进程间交互的流程

4.4 错误消息及日志记录的实现

4.4.1 错误消息记录的实现

4.4.2 日志记录的实现

4.5 技术难点在实现中的解决

4.5.1 短作业调度优化问题

4.5.2 并行作业互斥问题

4.5.3 容错处理问题

4.5.4 资源分配控制问题

4.6 本章小结

第5章 短作业调度模块的测试及分析

5.1 功能性测试及分析

5.1.1 会话建立的测试

5.1.2 任务解析运行测试

5.1.3 进程守护测试

5.1.4 检查点测试

5.1.5 功能测试结果分析

5.2 性能测试及分析

5.2.1 性能测试

5.2.2 性能测试结果分析

5.3 本章小结

结 论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致 谢

个人简历

展开▼

摘要

利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,这种计算方式叫网格计算。网格计算使得人们充分利用网络中的各种资源,协调计算机网络中作业的运行,为用户提供一体化信息和应用服务。
  本论文以Platform公司的网格计算产品LSF为基础,针对根据该产品在调度过程中对于短作业调度性能效率上的缺点提出研究方案,并设计实现短作业调度的独立模块。有效的控制了短作业调度过程中性能消耗过高的问题。使得产品的调度在大量短作业的情况下,作业调度更加有效和合理。
  本文中设计实现的内容符合原有的网格计算产品的理念,充分利用了已有的产品,并且以现有的产品框架为基础,开发了独立运行于原产品之外的调度模块,使得原有调度过程中调度负载降低。工作的内容涵盖了为短作业调度模块设计总体的结构以及同原主系统的交互,为其设计并实现作业在其中的调动过程和资源配置方式。
  本文研究的主要存在的问题和技术关键点包括了短作业调度优化的问题,降低并行冲突的控制,基于检查点技术的容错处理和任务重新运行的机制,资源收集分配和控制。
  通过对本文中内容的研究,最终实现了短作业调度模块与原产品的完全整合,在能够合理的分配计算资源且有一定容错措施的基础上,达到了提高短作业调度性能的目的。

著录项

  • 作者

    郭鑫;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 王宇颖,童涛;
  • 年度 2010
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.52;
  • 关键词

    网格计算系统; 作业调度; 模块设计; 软件工程;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号