基于概念格的关联规则提取及其渔业应用研究
近年来,数据挖掘(data mining)引起了信息产业界的极大关注,其主要原因是现实中存在大量数据,不能被充分使用,另一方面又存在着迫切需要将这些数据转化为有用的信息的需求。概念格(concept lattice)作为数据挖掘领域的重要分支,在研究及应用方面已取得了很大的进展。然而,由于现实世界数据的海量、异构和数据类型的多样性、结构的复杂性等特点,概念格应用在复杂环境下才是近年来的新研究方向。
本文研究了一种新的概念格约简算法(reduction algorithm),并将概念格引入关联规则(association rules),建立了基于概念格的关联规则提取模型。通常的约简算法主要讨论概念格的约简,而本文讨论的是基于形式背景(formal context)的约简。本文建立了一个新模型,其主要过程包括:形式背景的约简、概念格的建立、基于概念格的关联规则提取。该模型被应用于中西太平洋大眼金枪鱼的渔情分析。本文分析了渔场多环境因子与单位捕鱼量之间的关联关系。利用已有历史数据,研究并建立了一个实在的渔情概念格模式。与已报道的模型相比较,该模型提高了提取关联规则的有效性及准确性。
本文的主要工作及结果如下:
(1)提出了一种面向形式背景的约简算法:通过分析形式背景中的对象和属性的特征,将符合概念格约简定理的对象或属性进行约简。然后在更新后的形式背景的基础上,建立相应的概念格。
(2)将上述约简算法拓展到了动态形式背景的研究:在该算法中,首先提取出原形式背景的核心属性,将新增加的形式背景看成原形式背景的增量,建立增量后的形势背景的概念格。
(3)根据可用的渔业数据建立形式背景。将渔业数据按照以下方式进行预处理:对应于形式背景,渔业数据中的经纬度作为对象,环境因子与单位产量作为属性。分别将对象进行归一化处理和统一所有属性的分辨率。经过如此标准化预处理后的数据有利于提高了处理效率以及保证了试验数据的有效性。
(4)该模型成功应用于渔业研究中的多环境因子及单位作业次数的产量:本文以2004年的大眼金枪鱼数据作为试验数据来建立现实的概念格模型,中发现并验证了海面高度为渔业生产中的核心属性,对大眼金枪鱼的产量及其他环境因子的影响最大。
- 作者:
- 王燕华
- 学位授予单位:
- 上海海洋大学
- 专业名称:
- 计算机应用技术
- 授予学位:
- 硕士
- 学位年度:
- 2010年
- 导师姓名:
- 袁红春、王德兴
- 中图分类号:
- TP311.12;S934