高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

图像内容分析方法与应用研究

随着多媒体技术、互联网技术及移动信息技术的快速发展,图像和视频成为日益重要的信息载体.如何有效地管理海量的图片和视频资源,并高效地从这些资源中挖掘出有应用价值的信息,是当前计算机应用技术领域的重要研究课题.其中模式识别和计算机视觉技术的应用,为解决这一问题提供了必要的方法和手段,图像内容分析技术作为计算机视觉技术的一个重要组成部分,具有重要的研究价值和应用前景.
在实际应用中,图像中的口标(Object)通常是理解图像内容的重要线索,也是分析图像内容的重要层次之一.以目标为中心(object-based)的内容分析是图像内容分析研究的一个重要分支,本文着重针对基于视觉目标的图像内容分析相关问题:图像中的目标分类、图像中的目标检测、基于检测的目标跟踪以及特征融合和特征变换,展开方法研究和应用系统开发.本文的主要工作总结如下:
(1)设计了一种基于非负稀疏分解的图像目标分类方法.不同于传统的稀疏表示分类方法:
ⅰ)对每一类通过非负稀疏表示学习得到该类别的"正负词典",而不是采用与类别无关的统一的一个词典,增强了稀疏表示词典的区分能力;
ⅱ)分解系数非负性约束的引入,不仅有更明确的生物物理背景,而且非负分解特性更合乎人类视觉感知的直观体验;
ⅲ)基于正负词典对测试图像进行非负稀疏重构,通过对最构系数进行分析而不是通过重构误差来完成对该图像的分类.基于bag-of-words模型本身的数据非负性和整体是局部的非负线性组合特性,该方法与bag-of-words模型的融合在图像目标分类实验中取得了较好的分类效果.
(2)针对模式识别与计算机视觉领域常用的直方图特征,引入了一种简单有效的幂指数特征变换方法.大量实验结果表明,这种特征变换能够提高直方图特征的线性可分性和判别能力,使得变换后的直方图特征无需采用复杂的卡方(X2)距离或者测地距离(EMD)度量而采用简单的欧氏距离度量就可以明显提高图像分类与目标检测的正确率.在目标检测的实验中,该变换在SVM的RBF核上取得了优于X2核的实验效果,但运算速度比X2核快了近20倍.
(3)设计了一种基于超像素的图像目标检测方法.通过对图像的过分割处理,设计了一种基于超像素得到候选检测窗口的高效算法.实验结果表明,相对丁传统的滑动窗方法,候选窗口的数目平均减少了38%,同时检测的准确度也得到了提高,并且通过一次分割和算法分析得到的候选检测窗口,可以用来进行图像中多个目标的检测.
(4)设计了一种半监督在线学习的视频目标榆测跟踪方法.针对监督式机器学习需要大量带标签样本的问题,研制了一种基于视频帧域自适应的半临督在线学习方法,充分利用同一帧域内视频帧的相似性,结合随机森林分类器用自训练的方式对分类器进行更新,实现了对视频中特定目标对象的在线自适应检测与跟踪.对比实验表明了该方法的有效性.
(5)在以上研究成果的基础上,结合实际应用开发完成了非法图像信息判别系统和用于电子商务平台的图像检索系统.其中,非法图像信息判别系统已经在江苏电信上线稳定运行一年半,在广西电信上线稳定运行一年,并由华为公司用来进行海外业务推广.

作者:
张荣国
学位授予单位:
中国科学院研究生院
专业名称:
模式识别与智能系统
授予学位:
博士
学位年度:
2011年
导师姓名:
王春恒
关键词:
图像内容分析方法;工作原理;技术参数;特征信息;欧氏距离
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是