Audio-Visual Perception of Omnidirectional Video for Virtual Reality Applications

机译：虚拟现实应用全向视频的视听感知

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Ambisonics, which constructs a sound distribution over the full viewing sphere, improves immersive experience in omnidirectional video (ODV) by enabling observers to perceive the sound directions. Thus, human attention could be guided by audio and visual stimuli simultaneously. Numerous datasets have been proposed to investigate human visual attention by collecting eye fixations of observers navigating ODV with head-mounted displays (HMD). However, there is no such dataset analyzing the impact of audio information. In this paper, we establish a new audio-visual attention dataset for ODV with mute, mono, and ambisonics. The user behavior including visual attention corresponding to sound source locations, viewing navigation congruence between observers and fixations distributions in these three audio modalities is studied based on video and audio content. From our statistical analysis, we preliminarily found that, compared to only perceiving visual cues, perceiving visual cues with salient object sound (i.e., human voice, siren of ambulance) could draw more visual attention to the objects making sound and guide viewing behaviour when such objects are not in the current field of view. The more in-depth interactive effects between audio and visual cues in mute, mono and ambisonics still require further comprehensive study. The dataset and developed testbed in this initial work will be publicly available with the paper to foster future research on audio-visual attention for ODV.

机译：Ambisonics构建了整个观看范围内的声音分布，通过使观察者能够感知声音的方向，从而改善了全向视频（ODV）的沉浸式体验。因此，人们的注意力可以同时受到音频和视觉刺激的引导。已经提出了许多数据集，以通过收集使用头戴式显示器（HMD）导航ODV的观察者的眼神来调查人类的视觉注意力。但是，没有这样的数据集可以分析音频信息的影响。在本文中，我们为带有静音，单声道和歧音的ODV建立了一个新的视听注意力数据集。基于视频和音频内容，研究了包括与声源位置相对应的视觉注意力，观察者之间的观看导航一致性以及这三种音频模态中的注视分布在内的用户行为。从我们的统计分析中，我们初步发现，与仅感知视觉线索相比，感知带有明显物体声音的视觉线索（例如，人声，救护车警笛声）可以将更多的视觉注意力吸引到发出声音的物体上，并在这种情况下引导观看行为对象不在当前视野中。静音，单声道和混音中音视频提示之间更深入的交互效果仍需要进一步的综合研究。该初始工作中的数据集和开发的测试平台将随该文件公开提供，以促进对ODV视听注意力的未来研究。

著录项

来源
《IEEE International Conference on Multimedia Expo Workshops》|2020年|1-6|共6页
会议地点
作者
Fang-Yi Chao; Cagri Ozcinar; Chen Wang; Emin Zerman; Lu Zhang; Wassim Hamidouche; Olivier Deforges; Aljosa Smolic;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Ambisonics; omnidirectional video; virtual reality (VR); visual attention; audio-visual saliency;

机译：立体声;全向视频;虚拟现实（VR）;视觉注意力;视听显着性;

相似文献

外文文献
中文文献
专利

1. Visual Attention-Aware Omnidirectional Video Streaming Using Optimal Tiles for Virtual Reality [J] . Ozcinar Cagri, Cabrera Julian, Smolic Aljosa Emerging and Selected Topics in Circuits and Systems, IEEE Journal on . 2019,第1期

机译：使用最佳图块实现虚拟现实的视觉注意感知全向视频流
2. Visual Attention-Aware Omnidirectional Video Streaming Using Optimal Tiles for Virtual Reality [J] . Ozcinar Cagri, Cabrera Julian, Smolic Aljosa Emerging and Selected Topics in Circuits and Systems, IEEE Journal on . 2019,第1期

机译：使用最佳瓦片进行虚拟现实的视觉注意力感知全向视频流
3. Recent advances in omnidirectional video coding for virtual reality: Projection and evaluation [J] . Zhenzhong Chen, Yiming Li, Yingxue Zhang Signal processing . 2018,第MAY期

机译：用于虚拟现实的全向视频编码的最新进展：投影和评估
4. Visual Attention in Omnidirectional Video for Virtual Reality Applications [C] . Cagri Ozcinar, Aljosa Smolic International Conference on Quality of Multimedia Experience . 2018

机译：虚拟现实应用全向视频中的视觉注意
5. Developing virtual reality applications: The design and evaluation of virtual reality development tools for novice users. [D] . Kabala, David. 2011

机译：开发虚拟现实应用程序：为新手用户设计和评估虚拟现实开发工具。
6. Augmented Versus Virtual Reality in Education: An Exploratory Study Examining Science Knowledge Retention When Using Augmented Reality/Virtual Reality Mobile Applications [O] . Kuo-Ting Huang, Christopher Ball, Jessica Francis, -1

机译：教育中的增强与虚拟现实：使用增强现实/虚拟现实移动应用程序检查科学知识保留的探索性研究
7. Towards Audio-Visual Saliency Prediction for Omnidirectional Video with Spatial Audio [O] . Fang-Yi Chao, Cagri Ozcinar, Lu Zhang, 2020

机译：空间音频对全向视频的视听显着性预测

Audio-Visual Perception of Omnidirectional Video for Virtual Reality Applications

摘要

著录项

相似文献

相关主题

期刊订阅