首页> 中文学位 >基于视觉感知的视频压缩算法研究
【6h】

基于视觉感知的视频压缩算法研究

代理获取

摘要

随着网络建设的发展和信息技术的普及,多媒体通信已经成为当代社会生活的一个重要组成部分。由于多媒体数据尤其是视频数据量的巨大,为了满足传输带宽需求,视频信号通常需要高度压缩,以消除数据间的冗余。现今,大多数视频编码器关心的主要问题是如何去掉序列中时间冗余、空间冗余、编码冗余等信息。但是,人眼是所有视频的最终接受体,根据人眼视觉系统的特性,图像或视频数据中还存在较多的视觉心理冗余成分。因此,如何有效地消除视觉冗余成为了视频编码领域的一大挑战。现在已有越来越多的人将目光转向了结合人眼特性的视频压缩技术方向,该方向已经成为视频压缩领域的热门发展方向。本课题的主要工作就是对人眼部分特性进行研究,并建立相应的模型,应用于视频编解码器中,指导编码器完成更加高效的编码。
   本文首先简要介绍了图像数据压缩方法和常见的冗余数据类型,以及以MPEG系列、H.26x系列、AVS标准为代表的国内外主流视频编解码和它们各自的特点,并对本文的选题和主要工作做了说明。
   然后介绍了视觉生理学和视觉心理学上对人眼特性的研究成果,包括人眼在亮度、频率、色觉等方面的特性,总结了视觉研究的现状和在图像领域的应用情况,研究了视频编解码中采用的几种视觉掩盖模型。
   本文深入研究了人眼在亮度和色度方面的特性,并利用已知的视觉特性原理,分别从亮度和色度两个方面建立了视觉编码模型,将建立在YUV域基础上的视频信号分亮度块和色度块两个部分进行处理,并将压缩产生的误差控制在人眼可视门限以下,在保证解码图像主观质量的基础上,提高系统的压缩率。实验表明,视觉压缩模型的引入有效降低了编码端码率,而主观重构质量同标准解码器的输出一致。
   最后对全文进行总结,对有待继续研究的工作提出初步设想。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号