基于Petri网的数据挖掘网格中作业调度的研究
近年来,由于数据信息量的激增,数据挖掘面临高计算量的挑战,计算问题成了数据挖掘进一步发展的主要瓶颈。网格作为一门整合资源的技术,它的出现为数据挖掘中计算能力不足的缺陷提供了一条解决途径。因此把数据挖掘技术与网格技术的有机结合,产生了一种专用网格即数据挖掘网格。它主要用来解决面向海量数据的、高计算能力要求的数据挖掘问题,并能够在动态变化的多个网格节点间共享资源和协同解决面向各领域的智能分析问题。
数据挖掘应用本身具有很大复杂性,而网格本身也具有异构性和动态性,从而导致数据挖掘网格具有自己的特点,因而,很多关键技术还有待进一步研究,作业调度技术便是其中之一。作业调度的核心功能是识别作业的资源需求,查询、分配、调度和监视资源,以尽可能高效地利用资源,提高整个网格系统的性能,保证资源使用者和提供者的利益。本文围绕作业调度所涉及到的关键技术,对作业调度架构、作业调度建模等方面进行了系统而深入的研究,主要工作包括以下两个方面:
一方面是在分析作业调度功能需求的基础上,定义了一种数据挖掘网格作业描述方法,对各粒度作业之间的分解规则进行了详细定义,设计了一种基于分层结构的作业调度框架,并对其模块功能、动态特性和交互关系等进行详细地阐述。
另一方面是根据作业的划分结构设计了一种基于分层着色Petri网的作业调度模型。该模型将作业调度从上到下进行了分解,越到下层调度的粒度越细,越到上层越侧重于作业整体上调度过程的描述。它不仅能够对作业调度的过程进行精确定义,还能对整个过程进行正确性分析。
- 作者:
- 刁丽娟
- 学位授予单位:
- 沈阳理工大学
- 专业名称:
- 计算机应用技术
- 授予学位:
- 硕士
- 学位年度:
- 2010年
- 导师姓名:
- 张明扬
- 中图分类号:
- TP315;TP393.09
- 关键词:
- Petri网;数据挖掘网格;作业调度;分层着色
- data mining;grid architecture;Petri net;job scheduling;modeling