Constrained Optimization for Audio-to-Visual Conversion

Kyoung-Ho Choi; Jenq-Neng Hwang

首页> 外文期刊>IEEE Transactions on Signal Processing >Constrained Optimization for Audio-to-Visual Conversion

【24h】

Constrained Optimization for Audio-to-Visual Conversion

机译：视听转换的约束优化

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We have developed a new audio-to-visual conversion algorithm that uses a constrained optimization approach to take advantage of dynamics of mouth movements. Based on facial muscle analysis, the dynamics of mouth movements is modeled, and constraints are obtained from it. The obtained constraints are used to estimate visual parameters from speech in a framework of hidden Markov model (HMM)-based visual parameter estimation. To solve the constrained optimization problem, the Lagrangian approach is used to transform the constrained problem into an unconstrained problem in our implementation. The proposed method is tested on various noisy environments to show its robustness and correctness. Our proposed algorithm is favorably compared with the mixture-based HMM method, which also uses audio-visual HMMs and finds optimal estimates based on a joint audio-visual probability distribution. Our proposed algorithm can estimate optimal visual parameters while satisfying the constraints and avoiding performance degradation in noisy environments.

机译：我们已经开发了一种新的视听转换算法，该算法使用约束优化方法来利用嘴巴运动的动态。基于面部肌肉分析，对嘴部运动的动力学建模，并从中获得约束。在基于隐马尔可夫模型（HMM）的视觉参数估计框架中，将获得的约束用于从语音估计视觉参数。为了解决约束优化问题，在我们的实现中使用拉格朗日方法将约束问题转化为无约束问题。所提出的方法在各种嘈杂的环境下进行了测试，以显示其鲁棒性和正确性。与基于混合的HMM方法相比，我们提出的算法具有优势，后者同时使用视听HMM并根据联合视听概率分布找到最佳估计。我们提出的算法可以在满足约束条件的同时估计最佳视觉参数，并避免在嘈杂环境中降低性能。

著录项

来源
《IEEE Transactions on Signal Processing》 |2004年第6期|p.1783-1790|共8页
作者
Kyoung-Ho Choi; Jenq-Neng Hwang;
展开▼
作者单位

Electronics and Telecommunications Research Institute, (ETRI), Computer Software Laboratory, Spatial Information Technology Center, Daejeon, 305-350, South Korea;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类通信理论;
关键词
Audio-to-visual conversion; HMM; HMMI; talking heads;

机译：视听转换;HMM;HMMI;会说话的人;
入库时间 2022-08-18 00:18:15

相似文献

外文文献
中文文献
专利

1. Hidden Markov Model Inversion for Audio-to-Visual Conversion in an MPEG-4 Facial Animation System [J] . KYOUNGHO CHOI, YING LUO, JENQ-NENG HWANG Journal of VLSI signal processing . 2001,第1a2期

机译：MPEG-4面部动画系统中用于视听转换的隐马尔可夫模型反演
2. Audio-to-visual conversion for multimedia communication [J] . Rao R.R., Tsuhan Chen IEEE Transactions on Industrial Electronics . 1998,第1期

机译：多媒体通信的视听转换
3. Power-Constrained RGB-to-RGBW Conversion for Emissive Displays: Optimization-Based Approaches [J] . Chul Lee, Vishal Monga IEEE Transactions on Circuits and Systems for Video Technology . 2016,第10期

机译：发射显示器的功率受限RGB到RGBW转换：基于优化的方法
4. Audio-to-Visual Speech Conversion using Deep Neural Networks [C] . Sarah Taylor, Akihiro Kato, Iain Matthews, Annual Conference of the International Speech Communication Association . 2016

机译：使用深神经网络的视听语音转换
5. Data Conversion Within Energy Constrained Environments [D] . Kelly, Brandon M. 2017

机译：能源受限环境中的数据转换
6. Optimization of retinotopy constrained source estimation constrained by prior [O] . Donald J. Hagler Jr. 2014

机译：先验约束的视黄质约束源估计的优化
7. Audio-to-Visual Speech Conversion using Deep Neural Networks [O] . Taylor Sarah, Kato Akihiro, Milner Ben, 2016

机译：使用深度神经网络进行视听语音转换

Constrained Optimization for Audio-to-Visual Conversion

摘要

著录项

相似文献

相关主题

期刊订阅