高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

图的频繁子结构挖掘方法研究
Research on Graph Frequent Substructure Mining Method

随着互联网、数据库等信息技术的快速发展,网络上产生并积累了大量Xml文档、Web网页、化学化合物、生物分子等半结构化数据,这些结构复杂的数据往往隐藏了丰富的知识.频繁模式挖掘可以发现潜在的规律和模式,在实际应用中被广泛使用.图作为一种重要的数据结构,能够表达丰富的语义,适合用于半结构化数据建模.对半结构化数据的频繁模式挖掘可以转化为对图的频繁子结构挖掘.图的频繁子结构挖掘主要分为树(无环图)的频繁子结构挖掘和图(有环图)的频繁子结构挖掘两个方向.对于树的频繁子结构挖掘,目前主要有基于"候选子结构-计算支持度"和基于"投影数据库"思想的两类算法.本文针对基于"候选子结构-计算支持度"思想的相关算法不能生成所有候选子树而造成频繁子树信息遗漏,以及输出大规模且带有冗余信息的频繁子树进而影响后续分析效率的不足分别提出了GAST(Get All SubTrees)算法和MCRP(Mining Coverage Pattern)算法.GAST算法采用宽度孩子数编码方式对树中的结点进行编码,并在此基础上采用最大前缀编码序列进行边扩展生成所有候选子树,避免了信息的遗漏.MCRP算法在GAST算法基础上,只输出满足-覆盖条件的频繁子树,即覆盖模式,降低了输出频繁子树信息的冗余.对于图的频繁子结构挖掘,目前主要是基于"候选子结构-计算支持度"思想的算法.该类算法在计算候选子图支持度时涉及到子图同构判断,导致算法时间效率较低.针对这类算法的不足,本文借鉴树的频繁子结构挖掘中基于"投影数据库"的思想,提出了MFSGBPC(Mining Frequent SubGraph Based on Projection Coding)算法用于挖掘频繁子图.该算法将计算候选子图支持度的操作转换为了计算候选结点支持度的操作,避免了子图同构判断操作,在一定程度上提高了时间效率.理论分析和实验表明,与传统频繁子图挖掘算法相比,本文所提出的MCRP算法更加有效,能生成所有候选子树且避免冗余;MFSGBPC算法避免生成候选子图和计算候选子图支持度,在效率上有所提升.

作者:
李洪旭
学位授予单位:
重庆邮电大学
专业名称:
计算机科学与技术
授予学位:
硕士
学位年度:
2017年
导师姓名:
夏英
中图分类号:
TP311.13
关键词:
图的子结构;频繁子树;频繁子图;宽度孩子数编码;最大前缀编码序列;覆盖模式;投影数据库
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是