首页> 外文OA文献 >Obtención y adaptación de mapas de profundidad en vídeo estereoscópico: influencia en la codificación y el comportamiento visual tridimensional en tiempo real
【2h】

Obtención y adaptación de mapas de profundidad en vídeo estereoscópico: influencia en la codificación y el comportamiento visual tridimensional en tiempo real

机译:获取和调整立体视频中的深度图:实时影响编码和三维视觉行为

摘要

En esta tesis se recoge el trabajo realizado centrado en el estudio del vídeo estereoscópico y, en particular, la información que aportan los mapas de disparidad y sus posibles aplicaciones. El trabajo se ha dividido en tres bloques diferenciados: En primer lugar se presentan los resultados de un codificador de vídeo multivista basado en mapas de disparidad previamente computados. La finalidad del estudio es comprobar los efectos de la aplicación directa de la disparidad para la compensación entre vistas en cuanto a reducción del tiempo de procesado y calidad de la compresión sobre algoritmos basados en división de bloques, como AVC o HEVC. También se ha trabajado para obtener un flujo de vídeo compatible con MVC que contenga la información de los mapas de disparidad embebida en el flujo en forma de vectores de compensación. Estos mapas se usan como base para obtener la compensación entre bloques de la imagen derecha e izquierda. Para reducir aún más el coste computacional, se ha diseñado un algoritmo de decisión previa del tamaño del bloque de compensación. Aquí se presentan los resultados de ambas estrategias, con decisión previa y sin ella, para evaluar las alternativas. Se presentan los resultados tanto sobre imágenes estereoscópicas estáticas como secuencias de vídeo estereoscópico, cada una de ellas a diferentes valores de compresión de forma que se obtenga una referencia parametrizada del comportamiento del algoritmo. Dichos resultados revelan una reducción drástica del tiempo de procesado con estabilización de la tasa binaria para valores de compresión moderados (compresión de alta calidad), mientras que para compresiones severas, la tasa binaria crece en comparación con el software de referencia JMVC. En segundo lugar se realiza un análisis de calidad relacionado con la información de disparidad de las secuencias estereoscópicas, sus valores absolutos y sus derivadas temporales, de modo que pueda servir tanto para generar sistemas automáticos de evaluación de la calidad, como para sintetizar una lista de buenas prácticas para la creación de contenidos audiovisuales estereoscópicos que ofrezcan una calidad de la experiencia elevada. Para relacionar la calidad de la experiencia y el confort visual generado por una secuencia estereoscópica se ha llevado a cabo una serie de tests de visualización por parte de un grupo de observadores, de secuencias previamente generadas y catalogadas en base a sus variaciones de la disparidad y de movimiento. Las conclusiones extraídas indican que los paralajes negativos son más efectistas y ofrecen una inmersión mayor y, por tanto, mejor calidad de la experiencia, cuando se utilizan de forma moderada. Variaciones rápidas de los valores de disparidad negativa y variaciones de movimiento de objetos con disparidad negativa generan disconfort visual. La probabilidad de que paralajes positivos generen disconfort visual son mucho menores, por lo que resulta interesante en este caso utilizar variaciones rápidas de disparidad y movimiento para compensar la falta de efectismo que producen dichos paralajes. Por último, se ha planteado el diseño de un sistema de inserción coherente de gráficos, en tiempo real, en una escena estereoscópica. Se ha hecho hincapié en la necesidad de la coherencia entre la disparidad de los objetos que conforman una escena y las oclusiones que éstos producen, por lo que la inserción de un elemento no nativo de la escena debe tener en cuenta esta circunstancia para mantener la calidad de la experiencia estereoscópica. Se ha estudiado la influencia de la calidad del mapa de disparidad de la escena como base sobre la que realizar la inserción, así como posibles formas de modificar dicho mapa para que la inserción produzca el efecto deseado de coherencia. En concreto se ha postulado que es preferible sacrificar la precisión punto a punto del mapa de disparidad si, de esa manera, se evita cometer pequeños errores aislados de inserción, a costa de introducir un ajuste menos fino en los bordes de los objetos.
机译:本论文包括针对立体视频的研究,尤其是视差图及其可能应用提供的信息。这项工作已分为三个不同的块:首先,介绍了基于先前计算的视差图的多视图视频编码器的结果。该研究的目的是测试减少视差的直接应用视差补偿在基于块分割的算法(例如AVC或HEVC)上在减少处理时间和压缩质量方面的效果。还已经做出努力来获得符合MVC的视频流,该视频流包含以偏移矢量的形式来自嵌入在流中的视差图的信息。这些映射用作获得左右图像块之间补偿的基础。为了进一步降低计算成本,已经设计了补偿块大小的预定算法。在这里,无论是否有事先决定,都将介绍这两种策略的结果,以评估替代方案。将结果显示在静态立体图像和立体视频序列上,每个图像均具有不同的压缩值,以便获得算法行为的参数化参考。这些结果表明,对于中等压缩值(高质量压缩),比特率稳定,处理时间大大减少,而对于严重压缩,与参考JMVC软件相比,比特率增加了。其次,对与立体序列的视差,其绝对值和其时间导数有关的信息进行质量分析,以便它既可以用于生成自动质量评估系统,又可以用于合成质量清单创建提供高质量体验的立体视听内容的良好做法。为了将体验的质量和立体序列产生的视觉舒适度联系起来,一组观察者对视点和视差的变化对先前生成和分类的序列进行了一系列可视化测试。运动。得出的结论表明,以适度的方式使用负视差会更有效,并具有更好的沉浸感,因此会带来更好的体验质量。负视差值的快速变化以及具有负视差的对象的运动变化会产生视觉不适。正视差产生视觉不适的可能性要低得多,因此在这种情况下,使用视差和运动的快速变化来补偿所述视差产生的效果不足是很有趣的。最后,已经考虑了用于将图形实时地插入立体场景中的相干系统的设计。强调了组成场景的对象的视差与它们所产生的遮挡之间的连贯性的需要,因此,插入场景的非本机元素必须考虑到这种情况以保持质量。立体体验。已经研究了场景视差图的质量作为插入视差图的基础的影响,以及修改所述图以使插入产生所需连贯效果的可能方法。具体地,已经假定优选的是,如果这样避免了小的孤立的插入误差,则以对对象的边缘引入不太精细的调整为代价,牺牲视差图的点对点精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号