高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于谱聚类的混合流形学习算法研究

随着电子信息技术进步,各种形态的数据不断指数级爆炸增长.当我们面对这些海量的高维数据,需要能够按照我们预期的目的进行有效的处理以及利用.从大量的信息当中挖掘出有用的信息是模式识别以及计算机视觉等很多领域共同关注的研究难题.流形学习是一种极为有效的数据处理方式,从原始数据当中挖掘出我们可以利用的有效信息.本文研究了复杂分布数据的混合流形聚类,包括现实生活中的真实物体数据集,人造的数据集,以及人脸数据集等等.对于混合流形数据,由于分布的复杂性,特别是不同流形相互重叠的部分,传统的算法思想仅仅考虑了数据集中点与点之间的联系,并没有考虑到重叠区域数据点由于欧式距离较近,将会使得本来处于两个聚类的数据点会被划分到一个聚类当中,从而导致数据聚类错误率的增加.基于这种情况,我们除了考虑数据点本身的特性,还要考虑其他方面的因素.比如:数据点的几何切空间(衡量数据分布状态的一种方式)等.传统的K均值聚类,需要数据点必须为n维空间向量.使得计算速度慢,消耗很多内存.而谱聚类基于这一问题,对高维数据降维,使用一些特征向量来近似代表高维的原始数据.因此,谱聚类具有计算速度快,并且不容易受到噪声以及边界的影响,具有很强的鲁棒性.借鉴谱聚类算法的优点,对于相似矩阵的选取,在传统基于欧式距离的基础上,充分考虑了数据内含的其他几何信息,构造出更加适合与混合流形聚类的亲和矩阵.另外,从最初的近邻点的选取,到亲和矩阵的构造,再到拉普拉斯矩阵,从而求得低维嵌入数据.因此,基于谱聚类的算法最根本的就是近邻点的选取.考虑到是混合流形,尽管可能距离很近,要求近邻点应该尽可能地来自同一个流形.我们深入研究了除了距离还有局部几何信息的近邻点的选取方法.本论文还提出了迭代加权的子空间聚类.对于这种算法,核心就是迭代的加权算法框架,相比于原来的标准最小化框架,迭代最小框架聚类效果更好.通过在人造数据集以及真实的数据上测试其算法效率,相比于传统的算法效率更高.另外,我们不单单对这些算法进行理论的研究,还将这些算法广泛应用到实际应用当中,比如:人脸识别,图像分割、文本聚类等等.另外一个方面,文章针对当前基于谱聚类的一些算法进行了分析比较研究,但基本都存在一些共同的问题还没有得到很好的解决.比如:如何选取合适的拉普拉斯矩阵,怎样依靠计算机程序对流形聚类数据类数目实现自动选取,以及如何充分利用特征向量问题等等.这些问题还需要我们进一步的研究探索.

作者:
付刚
学位授予单位:
安徽理工大学
专业名称:
计算机科学与技术
授予学位:
硕士
学位年度:
2016年
导师姓名:
吴观茂
中图分类号:
TP181;TP311.13
关键词:
谱聚类;流行学习;混合流形聚类;拉普拉斯矩阵
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是