Expressive visual text to speech and expression adaptation using deep neural networks

机译：使用深神经网络的言语和表达式适应的表现力的视觉文本

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we present an expressive visual text to speech system (VTTS) based on a deep neural network (DNN). Given an input text sentence and a set of expression tags, the VTTS is able to produce not only the audio speech, but also the accompanying facial movements. The expressions can either be one of the expressions in the training corpus or a blend of expressions from the training corpus. Furthermore, we present a method of adapting a previously trained DNN to include a new expression using a small amount of training data. Experiments show that the proposed DNN-based VTTS is preferred by 57.9% over the baseline hidden Markov model based VTTS which uses cluster adaptive training.

机译：在本文中，我们基于深神经网络（DNN）向语音系统（VTTS）提出了一种表现力的视觉文本。给定输入文本句子和一组表达式标签，VTTS不仅能够产生音频语音，而且能够产生伴随的面部运动。该表达可以是培训语料库中的表达式之一，也可以是来自培训语料库的表达式的表达式之一。此外，我们提出了一种方法，一种方法可以使用少量训练数据来调整先前培训的DNN以包括新表达式。实验表明，基于DNN的VTT的基于基于基线隐马尔可夫模型的VTT是优选的基于DNN的VTT，其使用集群自适应培训。

著录项

来源
《IEEE International Conference on Acoustics, Speech and Signal Processing》|2017年|4606-5264p|共5页
会议地点
作者
Jonathan Parker; Ranniery Maia; Yannis Stylianou; Roberto Cipolla;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TN912-53;
关键词
Expressive Visual Text to Speech; Expression Adaptation; Deep Neural Network;

机译：表达的视觉文本语音;表达式适应;深神经网络;

相似文献

外文文献
中文文献
专利

1. An Efficient Sentence-based Sentiment Analysis for Expressive Text-to-speech using Fuzzy Neural Network [J] . B. Sudhakar, R. Bensraj Research journal of applied science, engineering and technology . 2014,第3期

机译：基于有效句子的情感表达的模糊神经网络情感分析
2. An Efficient Sentence-based Sentiment Analysis for Expressive Text-to-speech using Fuzzy Neural Network [J] . B. Sudhakar, R. Bensraj Research journal of applied science, engineering and technology . 2014,第3期

机译：基于句子的情感文本与模糊神经网络的言论语言的情报情绪分析
3. A Theory on Deep Neural Network Based Vector-to-Vector Regression With an Illustration of Its Expressive Power in Speech Enhancement [J] . Qi Jun, Du Jun, Siniscalchi Sabato Marco, Audio, Speech, and Language Processing, IEEE/ACM Transactions on . 2019,第12期

机译：基于深度神经网络的矢量到矢量回归的理论及其在语音增强中的表达力的例证
4. Expressive visual text to speech and expression adaptation using deep neural networks [C] . Jonathan Parker, Ranniery Maia, Yannis Stylianou, IEEE International Conference on Acoustics, Speech and Signal Processing . 2017

机译：使用深度神经网络将表达性视觉文本转换为语音和表情
5. Deep Neural Language Model for Text Classification Based on Convolutional and Recurrent Neural Networks [D] . Hassan, Abdalraouf. 2018

机译：基于卷积神经网络和递归神经网络的深度神经语言文本分类模型
6. Expressive visual text-to-speech as an assistive technology for individuals with autism spectrum conditions [O] . S.A. Cassidy, B. Stenger, L. Van Dongen, -1

机译：富有表现力的视觉文字转语音作为自闭症患者的辅助技术
7. Speech Enhancement for a Noise-Robust Text-to-Speech Synthesis System using Deep Recurrent Neural Networks [O] . Valentini Botinhao, Cassia, Wang, Xin, Takaki, Shinji, 2016

机译：使用深度递归神经网络的噪声鲁棒文本到语音合成系统的语音增强

Expressive visual text to speech and expression adaptation using deep neural networks

摘要

著录项

相似文献

相关主题

期刊订阅