结合显著性检测与词袋模型的目标分类方法研究
Research on Objects Classification Method in Using Saliency Detection and Bag of Words Model
目标分类是计算机视觉中的重要研究方向,同时也是智能视频分析技术的基础,在图像处理以及视频分析等领域有着广泛的运用,具有很高的研究价值和意义.现阶段的目标分类研究在建模、训练、分类等过程中存在很多困难,其中主要的问题是如何在噪声、光照变化、目标遮挡以及目标形变等复杂环境下快速准确地进行目标分类.在过去的研究工作中,学者们在目标分类上取得了非常优秀的成果.从文本领域引入的词袋模型在这个过程中发挥了重要的作用.基于词袋模型的目标分类方法具有较好的适应性,能够有效抵消尺度、光照、姿态等变化引起的分类识别错误,但是,其不区分前景与背景的特征提取过程依然严重地影响目标分类的准确率.为了进一步提高目标分类的准确率,本文针对图像中背景干扰的问题提出了一种结合显著性检测与优化视觉词典的目标分类方法.本文主要工作如下:首先,采用基于图论的视觉显著性算法和基于全像素的显著性算法来计算原图像的显著图.单一的显著性检测算法可能导致提取的前景目标不完整或者保留的背景过多.由于计算机并不能准确地分析显著图的状态,所以本文采用两种不同的显著性算法分别计算显著图,再对两种显著图求取并集以便在保留完整前景目标的同时最大程度地消除背景.其次,使用改进的最大类间差分方法计算的显著图的二值化阈值来分割感兴趣区域,并将感兴趣区域与原图像结合以获取前景目标,再对前景目标提取尺度不变特征变换描述子.实验表明从前景目标中提取的特征相比于从整幅图像中提取的特征可以有效消除背景的干扰.最后,本文为了克服K均值聚类算法的缺陷,引入密度峰值聚类算法对特征向量进行聚类,并在生成视觉单词的过程中借鉴K近邻算法的思想对密度峰值聚类算法抛弃的特征向量进行二次划分,以便尽可能地保留目标的特征.实验结果表明更加准确的视觉词典有助于提升系统的分类准确率.
- 作者:
- 陈曦
- 学位授予单位:
- 重庆邮电大学
- 专业名称:
- 计算机科学与技术
- 授予学位:
- 硕士
- 学位年度:
- 2016年
- 导师姓名:
- 李伟生
- 中图分类号:
- TP391.41
- 关键词:
- 目标分类;词袋模型;显著性检测;密度峰值聚类;优化视觉单词
- objects classification; bag of words model; saliency detection; density peak clustering; optimization of visual words;