基于H.264的全局运动估计的研究
Global Motion Estimation Algorithm Research Based on H.264Standard
随着信息技术的发展,数字视频技术在通信和广播领域获得了日益广泛的应用.视频信息直观、高效,使之应用广泛,但是信息量很大,必须进行有效的视频压缩编码,同时要保证压缩后的视频质量.
被称为新一代视频编码标准的H.264/AVC性能优于以往的标准,是由ITU-T/ISO成立的联合项目组于2003年3月正式公布的,受到了广泛的关注.本论文就是以H.264/AVC视频编码标准为基础,深入剖析其编解码策略和技术特点,重点研究了其中的全局运动估计算法,并提出改进.
论文首先对H.264/AVC视频编码标准进行了简单介绍,研究了H.264常用的几种有效地提高编解码器压缩性能的关键技术,但是也相应地增加了计算复杂度.如果想要实现编解码器的实时运行,需要有效地降低运算复杂度,提高编码速度.全局运动估计是根据一定的摄像机运动模型,利用视频序列中背景的运动信息得到该模型的参数,它是计算机视觉、视频处理等领域广泛采用的手段之一.进行全局运动估计时有两个难点:首先是计算量大,难以达到实时应用的要求.其次是由于噪声点多,使估计的准确性难以得到保证.为了降低全局运动估计计算复杂度,可以选取有效的特征点参与运算,减少噪声像素点,提高全局运动估计计算速度.梯度运算是全局运动估计中常用的方法,梯度值小的点容易被噪声污染,这些像素点参与计算时,会使计算量增大,影响计算结果的精度.将参与计算的像素集合缩小为梯度较大的像素子集能明显提高计算速度,而不会影响算法的鲁棒性.本论文提出一种基于像素梯度的全局运动估计方法.运动模型采用了复杂性与准确性较好均衡的六参数仿射模型.同时,为了提高计算速度,采用了两层金字塔进行多分辨率计算,而且在每层迭代计算中都抽取梯度较大的特征点进行计算,同时结合了高斯-牛顿优化计算方法.实验验证了提出的全局运动估计算法的计算效率和精度.
论文最后介绍了DSP及CCS软件的相关知识,给出了H.264编解码器在DSP上的实现步骤及优化后的实验结果.
本文的研究成果可以应用在视频会议、可视电话、智能视频监控等多媒体通信领域中,具有一定的使用价值.
- 作者:
- 王思珺
- 学位授予单位:
- 中国科学院研究生院
- 专业名称:
- 机械电子工程
- 授予学位:
- 硕士
- 学位年度:
- 2011年
- 导师姓名:
- 赵建
- 中图分类号:
- TN919.81
- 关键词:
- H.264标准;全局运动估计;仿射变换;参数模型;迭代最小二乘法
- H.264;global motion estimation;affine transformation;parametermodel;iterative least squares method