首页> 中文学位 >高级视频编码中运动估计的算法改进与GPU并行优化
【6h】

高级视频编码中运动估计的算法改进与GPU并行优化

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 课题研究背景及意义

1.2 国内外相关研究进展

1.3 研究内容与章节安排

1.4 本章小结

2 H.264运动估计的算法流程与并行性分析

2.1 H.264视频编码的基本原理

2.2 运动估计搜索算法

2.3 H.264运动估计的复杂度分析

2.4 H.264运动估计的并行性分析

2.5 本章小结

3 H.264运动估计的CUDA并行优化

3.1 GPU硬件结构及CUDA编程模型

3.2 运动估计的算法改进

3.3 异步计算模型

3.4 多层次并行优化

3.5 并行优化方案的实现细节优化

3.6 本章小结

4 实验结果与分析

4.1 实验平台与环境

4.2 实验结果对比与分析

4.3 本章小结

5 总结与展望

5.1 本文研究工作

5.2 本文研究展望

致谢

参考文献

展开▼

摘要

运动估计是高级视频编码标准 H.264的核心部分之一,通过高效的帧间预测方法大幅提升了视频压缩比,但高计算复杂度问题却给实时视频编码带来巨大挑战。近年来随着图形处理器GPU(Graphics Processing Unit)的并行计算能力越来越强,基于GPU的CUDA(Compute Unified Device Architecture)编程模型为优化加速运动估计部分提供了机会。因而,充分挖掘运动估计的并行性,并利用GPU对其进行优化加速,对以视频直播为代表的实时编码应用的快速发展具有重大意义。
  通过对运动搜索算法的改进和并行性分析,提出了基于GPU平台的H.264运动估计并行优化方案。首先,提出了一种适应于GPU并行计算特点的两级搜索算法:第一级是粗粒度全局搜索,以4倍步长在搜索窗口中找到第一级最佳运动矢量;第二级是细粒度局部搜索,在第一级最佳运动矢量位置周边的5×5区域内进一步搜索得到最终的运动矢量。此算法不仅极大地减少了搜索点,而且便于CUDA编程实现,可充分利用 GPU的并行计算资源加速运动估计过程。其次,提出了 CPU残差编码与GPU运动估计的异步计算模型:将帧分为N个块,由于每个分块的运动估计不依赖其它分块,所以当CPU对第n-1(0  实验结果表明,采用两级搜索算法的并行优化方案比全搜索算法最高加速了40多倍,整体编码速度最高提升了30多倍;相比于一些快速搜索算法也有不同程度的加速。相应的视频质量损失在用户可接受范围内,峰值信噪比PSNR(Peak Signal to Noise Ratio)最大误差为1.2dB。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号