AlignNet: A Unifying Approach to Audio-Visual Alignment

机译：AlignNet：视听对准的统一方法

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

We present AlignNet, a model that synchronizes videos with reference audios undernon-uniform and irregularmis- alignments. AlignNet learns the end-to-end dense correspondence between each frame of a video and an audio. Our method is designed according to simple and well- established principles: attention, pyramidal processing, warping, and affinity function. Together with the model, we release a dancing dataset Dance50 for training and evaluation. Qualitative, quantitative and subjective evaluation results on dance-music alignment and speech-lip alignment demonstrate that our method far outperforms the state-of- the-art methods. Code, dataset and sample videos are available at our project page¹.

机译：我们介绍了AlignNet，该模型可将视频与参考音频在非均匀和不规则对齐下进行同步。 AlignNet了解视频和音频的每一帧之间的端到端密集对应。我们的方法是根据简单且公认的原则设计的：注意力，金字塔处理，扭曲和亲和力函数。与模型一起，我们发布了一个舞蹈数据集Dance50用于训练和评估。对舞曲音乐对齐和言语嘴唇对齐的定性，定量和主观评估结果表明，我们的方法远远优于最新方法。代码，数据集和示例视频可在我们的项目页面上找到 ^{1
。}

著录项

来源
《IEEE Winter Conference on Applications of Computer Vision》|2020年|3298-3306|共9页
会议地点
作者
Jianren Wang; Zhaoyuan Fang; Hang Zhao;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Feature extraction; Synchronization; Visualization; Task analysis; Training; Rhythm; Face;

机译：特征提取;同步;可视化;任务分析;训练;节奏;面部;

相似文献

外文文献
中文文献
专利

1. A unified approach to autofocus and alignment for pattern localization using hybrid weighted Hausdorff distance [J] . Dongjiang Xu Pattern recognition letters . 2011,第14期

机译：一种使用混合加权Hausdorff距离的自动聚焦和对准模式定位的统一方法
2. Separation of Audio-Visual Speech Sources: A New Approach Exploiting the Audio-Visual Coherence of Speech Stimuli [J] . David Sodoyer, Jean-Luc Schwartz, Laurent Girin, EURASIP journal on advances in signal processing . 2002,第11期

机译：视听语音源分离：利用语音刺激视听连贯的新方法
3. Policy alignment in the European audio-visual sector: A small-market perspective from Estonia [J] . ULRIKE ROHN, HENRY LOESER International Journal of Digital Television . 2020,第1期

机译：欧洲视听部门的政策对准：来自爱沙尼亚的小市场视角
4. A Unified Approach for Measuring Precision and Generalization Based on Anti-alignments [C] . B.F. van Dongen, J. Carmona, T. Chatain International conference on business process management . 2016

机译：基于反对齐的精度和泛化度量统一方法
5. Audio-Visual Asynchrony Modeling and Analysis for Speech Alignment and Recognition. [D] . Terry, Louis. 2011

机译：语音对齐和识别的视听异步建模和分析。
6. Evaluating audio-visual falls prevention messages with community-dwelling older people using a World Café forum approach [O] . Lex D. de Jong, Jacqueline Francis-Coad, Chris Wortham, 2019

机译：使用WorldCafé论坛方法与社区老年人评估视听预防跌倒信息
7. A Unified Approach to Multi-Pose Audio-Visual ASR [O] . Lucey Patrick J., Potamianos Gerasimos, Sridharan Sridha 2007

机译：多姿势视听ASR的统一方法

AlignNet: A Unifying Approach to Audio-Visual Alignment

摘要

著录项

相似文献

相关主题

期刊订阅