多视点视频编码
多视点视频编码的相关文献在2003年到2022年内共计191篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、科学、科学研究
等领域,其中期刊论文72篇、会议论文10篇、专利文献207774篇;相关期刊39种,包括宁波大学学报(理工版)、应用科学学报、重庆邮电大学学报(自然科学版)等;
相关会议9种,包括第十七届全国信号处理学术年会、中国电子学会第十八届信息论学术年会、2011年亚太青年通信学术会议(APYCC2011)等;多视点视频编码的相关文献由302位作者贡献,包括尹鹏、郁梅、蒋刚毅等。
多视点视频编码—发文量
专利文献>
论文:207774篇
占比:99.96%
总计:207856篇
多视点视频编码
-研究学者
- 尹鹏
- 郁梅
- 蒋刚毅
- 张兆杨
- 普尔温·比贝哈斯·潘迪特
- 朱威
- M·安尼克塞拉
- 安平
- 方健
- 苏野平
- 许南淏
- 严涛
- 彭宗举
- 李福翠
- Y-K·王
- 严基纹
- 孙立峰
- 张娜
- 张恩荣
- 戴琼海
- 李寿寅
- 田冬
- 苏叶平
- 贾克斌
- 邵枫
- 金泰源
- 金镇雄
- 傅松寅
- 普尔温.比布哈斯.潘迪特
- 朴光勋
- 朴慜祐
- 杨士强
- 邓智玭
- 陈耀武
- Y·陈
- 俞立
- 元辉
- 刘琚
- 刘静
- 宋允东
- 张云
- 徐卫芳
- 沈礼权
- 王好谦
- 王永芳
- 石鹏飞
- 范晓鹏
- 蔡灿辉
- 谢晓燕
- 赵德斌
-
-
杨铀;
李志龙;
吴科君;
蒋小广;
向森;
刘琼
-
-
摘要:
“元宇宙”概念的出现引起了学术界与产业界的广泛关注,它给人们带来了巨大的想象空间。作为元宇宙系统的底层基础,交互式多媒体技术能够满足元宇宙所需的虚实融合、逼真呈现、高交互性等应用特点,成为人们高度关注的研究领域。交互式媒体以三维场景为观察对象,以三维时空分布的点云、图像等为数据表达,在技术流程上包括三维视觉数据的获取、处理、显示等几大环节,形成了庞大的技术分支,汇聚了丰富的技术成果。本文从上述三个环节入手,分别对当前的最新技术和成果展开综述,报告了相关的科学问题、研究方法和技术效果。这些成果将为未来元宇宙系统的流畅运行奠定坚实的基础。
-
-
罗铖;
缪辰启
-
-
摘要:
在当今这个数据爆炸增长的时代,深度学习强大的非线性建模能力进一步提高了多视点视频编码的率失真性能.对此,介绍多视点视频的特点及应用,重点对深度学习背景下现有的多视点视频编码方法进行介绍和总结,并展望多视点视频编码未来的发展趋势,旨在进一步发挥深度学习的能力,为用户提供更佳的观看体验.
-
-
严涛;
闻辉;
黄金火;
陈德礼;
林元模;
车艳
-
-
摘要:
提出了自适应的多视点视频编码(Multi-view video coding,MVC)视点间预测结构算法.首先根据视点间相似度分析确定I-视点的位置,然后利用相机的几何关系预测I-视点和P-视点之间插入B-视点的数目,灵活调整视点间预测结构,提高编码效率.实验表明,所提出的算法与视点间独立编码相比,PSNR平均提高1.28 dB.
-
-
-
熊珊珊;
卿粼波;
陈真真;
杨红;
何小海
-
-
摘要:
在分布武多视点视频编码(distributed multi-view video coding,DMVC)数据传输过程中,编码方式不同导致K帧与WZ帧受信道误码影响也不相同,因此提出了一种DMVC整体容错传输框架,针对K帧及WZ帧特性设计了不同的容错保护传输方案并进行有效融合.针对K帧的容错传输问题,首先根据左、右相邻视点的对应K帧,利用DIBR算法产生的空间边信息对丢失块进行初始修复;然后根据K帧同一视点内的相邻已解码帧,生成它的时间参考帧,对K帧的丢失块进行重修复.针对WZ帧的容错传输问题,提出了基于不等错误保护(unequal error protection,UEP)的编码算法,根据不同频带的各个比特面的重要性不同,对低频带、高比特面进行更加合理的码率分配,在不增加编码端复杂度的前提下提高了WZ帧的误码容错性能.实验结果表明:在K帧和WZ帧均出现丢包的情况下(丢包率为5%~15%),相比K帧采用传统的帧内错误隐藏加WZ帧采用参考文献码率的算法,本文方案对视频序列重建图像的BD-PSNR平均提升了2.39~4.68 dB,且随着丢包率的增加,提升效果更加显著.
-
-
向瑞;
王中元
-
-
摘要:
Compression artifacts of the depth images generated by multi-view video coding always lead to seriously geometry distortions in synthesized views.To remove the noise caused by encoding in depth image, a depth image denoising algorithm based on graph cut was proposed.The local binary patterns operator of depth image and corresponding color image were incorporated into this algorithm, and the edge imformation of depth image was effectively kept.Experimental results show that the quality of the virtual viewpoint rendered using denoised depth image is also greatly improved, the proposed approach offers 0.35 dB average PSNR gains comparing with the traditional filtering method, as well as significant subjective improvement in synthesized views.%多视点视频编码给深度图带来的编码块效应,导致合成的虚拟视点中出现严重的几何失真,为去除深度图中编码带来的噪声,提出一种基于图割的深度图去噪算法.将深度图及相应的彩色图的局部二值模式(LBP)算子作为去噪的约束,融入算法中,有效保持深度图的边缘信息.实验结果表明,由去噪后深度图绘制的虚拟视点的质量得到大幅提高,相对目前优秀的滤波方法能平均获得0.35 dB的PSNR增益,主观效果的提升非常明显.
-
-
王萍;
刘琪;
张磊
-
-
摘要:
提出了一种针对多视点视频编码中Direct模式的提前终止算法.该算法基于当前编码宏块相邻视点、时间及空间方向的已编码邻近宏块的编码信息,提出了一个描述当前宏块的邻近块代价影响因子,通过与阈值比较可对多数编码宏块直接选择Direct模式进行编码,从而略过其他模式的相关计算.实验结果表明,与原始的多视点视频编码算法相比,该算法可平均减少约88.2%的编码时间,同时峰值信噪比仅下降约0.29dB,编码比特率增加约0.68%.
-
-
明艳
-
-
摘要:
Aimed at the high complexity of multi view video coding,a fast algorithm based on the correlation of adjacent macro-block’s coding information is proposed in this paper.Using the relativity of adjacent macro-block’s rate distortion cost distribution in inter views of multi view video,current macro-block’s SKIP mode can be prejudge.According to the motion vector difference in the adjoining domains from visual,temporal and spatial perspective,current macro-block’s mo-tion activity can be classified quickly.Search range is adjusted and suitable mode size is chosen in accordance with the dif-ferent motion activity.Through coding performance testing on multi view video sequences that has respective motion activity characteristics,the simulation results show that this algorithm achieves a reduction of the encoding time by 66% on aver-age,while incurring only 0.04 dB loss in peak signal-to-noise ratio and 0.75%increment on the total bit rate compare with JMVM ergodic model.%针对多视点视频编码的高复杂度,提出一种利用相邻宏块编码信息的相关性进行编码的快速算法。利用多视点视频相邻宏块率失真代价分布的相关性,对当前宏块进行SKIP模式下的提前判决;根据视点间、时间和空间相邻区域运动矢量差值对当前宏块运动类型进行快速分类;针对不同的运动类型调整搜索范围,选择相应尺寸大小的编码模式。通过对具有不同运动特性的多视点视频编码性能测试,结果表明,相对于联合多视点视频模型(joint multi view video model,JMVM)遍历模式,在增加0.75%输出比特率和降低0.04 dB峰值信噪比的情况下,该快速编码算法能平均减少66%的编码时间。
-
-
王凤随;
杨会成;
王冠凌;
韩超
-
-
摘要:
为解决多视点视频编码(MVC)计算复杂度过高的问题,提出一种多视点视频编码快速预测算法.计算当前宏块Direct模式的率失真代价并将其与自适应阈值进行比较,以提供有效的提前终止策略.当率失真代价小于自适应阈值时,Direct模式被选作最优模式,模式选择过程提前终止.当率失真代价大于自适应阈值时,利用运动复杂度将当前宏块分成不同的运动类型,每种类型的宏块仅检查指定的模式,从而使得不必要的模式检查过程提前结束.实验结果表明,该算法在保持几乎不变的编码效率基础上,大幅减少了MVC的计算量.
-
-
王华君;
李荣;
徐燕华;
孟德建
-
-
摘要:
针对多视点视频结构复杂、带宽大小非常有限的问题,提出了基于帧处理时间模型的多视点视频解码延迟分析框架,该框架的译码器在具有多线程处理能力的多核处理器上实现.首先,假设解码延迟系统每帧在一个独立专用的处理器上被解码;然后,利用有向无环图(DGA)计算硬件解码延迟;最后,在每次迭代中,计算解码计时和解码帧的数量,定义解码时间间隔.在多视点视频实验中,对于双核处器解码计算量在60ms能得到500ms下的通信延迟值,对于四核处理器100ms解码计算量也能得到500ms下的通信延迟值.实验结果表明,一帧处理时间的上限值可以保证目标延迟值,该框架可以应用到最小通信延迟的多视点视频编码系统.%For the issue that multi-view video has more complex structure and very limited bandwidth with the needing for the decoding delay analysis system, a framework of analysis of the decoding delay in multi-view coding (MVC) is proposed. The decoder of the framework achieves on multi-core processors capabilities of multi-threaded processing. Firstly, decoding delay system assumes each frame is decoded in a separate dedicated processor. Then, a directed acyclic-graph (DGA) is used to compute hardware decoding delay. Finally, the decoding timing and the number of decoded frames are calculated, and the decoding interval is defined. In multi-view video experiments, for dual-core decoder, the calculating cost in 60ms can get the delay value under 500ms. And for a four-core processor, the calculating cost in 100ms can also obtain the delay value under 500ms. Therefore the experimental results shows that a frame the upper limit of the processing time of a frame can guarantee target delay value, and the framework can be applied to multi-view video coding system of minimum communication delay.
-
-
WANG Bo-han;
汪博涵;
CHEN Jing;
陈婧;
ZENG Huan-qiang;
曾焕强;
CAI Can-hui;
蔡灿辉
- 《第十七届全国信号处理学术年会》
| 2015年
-
摘要:
现有的多视点视频编码使用了分层B帧(Hierarchical B Picture,HBP)的预测结构,其帧内预测、帧间预测以及视点间预测的模式选择给多视点视频编码带来了庞大的计算复杂度.针对这一问题,在分析了JMVC模式分布比例的基础上,提出了一个快速帧间模式选择的算法.这种算法利用率失真代价和预测模式特征之间的关系来及时判定最优模式:如果上一尺寸预测模式的率失真代价小于当前尺寸预测模式的率失真代价则认为上一预测模式为最优模式,跳过检查其他更小尺寸的预测模式;反之,如果上一尺寸的预测模式的率失真代价大于当前尺寸的预测模式的率失真代价,则继续检查其他更小的尺寸.这样,通过提前终止一些不必要的模式选择过程,多视点视频编码的计算量得到大幅的降低.实验结果表明:所提算法能在保持JMVC中全搜索算法的编码效率同时,使计算复杂度减少了81.66%.
-
-
-
-
皮师华;
蒋刚毅;
彭宗举;
邵枫;
傅松寅;
李福翠
- 《2010亚太地区信息论学术会议)》
| 2010年
-
摘要:
多视点视频编码采用了率失真优化技术来进行最优编码模式的选择,使得图像质量和编码比特率上达到平衡,大大提高了视频压缩效率。失真测度的选择对运动/视差估计中匹配块的选择有很大影响。在多视点视频编码校验模型中,失真测度选择的是当前块与参考块之间的绝对差和(SAD)和平方差和(SSD),但传统的失真测度并没有考虑人眼的视觉特性。结构相似度(SSIM)是新提出的一种图像质量评价方法,与其他评价方法相比,它更加符合人眼视觉系统且计算量不大,为进一步提高多视点视频编码中压缩效率,本文将SSIM代替传统的SAD和SSD作为失真测度,提出了一种视觉感知率失真模型算法(VPRDO)。实验结果显示,该算法可以在保持视觉质量不下降的前提下,平均节约12%左右的码流。
-
-
-
-
-
-
-
蒋刚毅;
朱仲杰;
郁梅;
吴训威
- 《第十一届全国图象图形学术会议》
| 2003年
-
摘要:
为了能得到一种具有立体感和交互操作功能的新型视频,在基于时空信息的单通道视频对象分割基础上,给出了多视点视频编码中视频对象的提取方案,并提出了一种基于对象的视差匹配算法,以提高视差估计的精确性和可靠性;并通过视差插值实现了视频对象的中间视点图象合成.实验结果显示所提出的方法是可行和有效的.