三维视频系统的用户体验质量评价
Research on Quality of Experience for Three-Dimensional Video System
在互联网快速发展和大数据的大背景下,大众的视觉体验效果得到了飞速的提升.3D视频会议系统、3D导航、3D医疗等先进技术给大众带来极大的便利同时,也不可避免地带来一些问题.在三维视频系统中,图像/视频的采集、编码、传输、显示等环节中或多或少地引入不同程度的失真,导致图像/视频质量的下降,进而使得终端的主观体验效果较差.三维视频系统中的用户体验质量评价可以有效监测不同阶段的体验质量,因此具有实用价值.本学位论文将从视觉感知出发将对平面图像、立体图像、以及平面视频三个方面研究用户体验质量评价问题.具体研究内容如下:(1)从人眼的双目融合与竞争特性出发,在特征提取方面进行深入挖掘,提出了一种基于双目融合与竞争的无参考立体图像质量评价方法.首先,将左右视点图像进行融合,对得到的独眼图像进行Gabor特征提取;然后对左右视点图像的绝对差值图提取特征;最后将两部分特征融合得到立体图像特征集,通过支持向量回归预测得到客观值.采用该方法对LIVE立体图像数据库进行评价,PLCC值和SROCC值均在0.94左右,优于其他参与对比的方法.表明该方法符合人眼视觉特性,能够很好地描述人眼感知特性.(2)从视频的运动信息的角度出发,同时依据人类视觉系统(Human visual system,HVS)处理图像的多通道特性以及人眼对运动物体的感知特性,提出了一种基于仿生视觉感知的多尺度视频质量评价方法,包括两个阶段:运动感知质量求取和空域质量求取.首先,为模拟HVS,将原始与失真视频序列分别进行5尺度的DOG分解得到5个频带分量;然后,利用运动能量模型对每个频带分量的时域失真进行评价,求得运动感知质量,利用梯度相似性对视频序列的空域失真进行评价得到空域质量向量;最后,采用随机森林建立质量向量与主观评分值之间的映射,预测得到视频序列的客观评价值.在公开的视频数据库上进行实验,结果表明,该方法性能较先进方法有了显著提高,LIVE视频数据库上PLCC已达到0.84,与主观感知具有较高一致性,具有较高的预测准确性.(3)从大脑可能以流形的方式对事物进行解读的角度出发,各失真图像的几何结构失真可以由低维流形特征有效表达,并能保持本质特征在流形空间中的不变性.提出的基于在线流形学习的彩色图像质量评价方法,通过求取参考和失真图像的最大显著图及最大显著差异性两步骤,提取视觉重要图像块,通过在线学习的方式利用正交局部保持投影算法训练得到特征基矩阵,最后,利用特征基矩阵将参考-失真视觉重要图像块映射到低维子流形上,得到流形特征矩阵对,从而预测得到客观评分值.针对目前有些IQA方法对非对称失真具有预测偏差以及仅对亮度分量处理的不足问题,提出的基于张量分解和流形学习的感知立体图像质量评价方法,将RGB彩色图像采用Tucker分解进行降维得到训练数据集,并利用流形学习方法求得特征基矩阵;然后,通过流形相似度的方法对左右视点分别预测;最后,基于双目竞争行为改进了一种基于局部能量比率的自适应双目联合模型,对左右视点质量进行融合.所提出方法与现有具有代表性的方法相比具有更好的预测性能,与人类主观感知有更好的一致性.
- 作者:
- 何美伶
- 学位授予单位:
- 宁波大学
- 专业名称:
- 通信与信息系统
- 授予学位:
- 硕士
- 学位年度:
- 2017年
- 导师姓名:
- 蒋刚毅
- 中图分类号:
- TP391.41
- 关键词:
- 三维视频系统;质量评价;双目视觉特性;张量分解;流形学习
- Three-dimensional Video System; Quality assessment; Binocular visual properties; Tensor decomposition; Manifold learning;