音声生成過程を考慮したWaveNetに基づく音声波形合成法

玉森聡; 林知樹; 戸田智基; 武田一哉

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声生成過程を考慮したWaveNetに基づく音声波形合成法

【24h】

音声生成過程を考慮したWaveNetに基づく音声波形合成法

机译：基于Wavenet考虑语音生成过程的语音波形综合方法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

我々は最近新たに提案されたニューラルネットワークであるWaveNetを援用することで，既存のソースフィルタモデルに課された種々の制約を解消する，音声波形を直接モデル化可能な新たなボコーダの実現を目指す．本研究では，ボコーダの音響パラメータをWaveNetの入力補助特徴量に用い，音声波形を合成する手法を提案する．これらパラメータは音声の生成過程を考慮して抽出されることから，補助特徴量として効果的に働くことが期待される．実験ではメルケプストラムボコーダのパラメータを対象とし，合成音声の品質をSNR（Signal-to-Noise Ratio）とSDR（Signal-to-Distortion Ratio）の2つの指標によって客観的に評価した．実験の結果，SNRについて有意な改善を得たことから，提案法の有効性が確認された．

机译：我们的目标是实现一种可以直接模型音频波形的新声码器，这消除了对现有源滤波器模型的各种约束，最近提出了新提出的神经网络。在本研究中，我们提出了一种使用Vocoder输入辅助特征数量的声码器声学参数的方法并合成语音波形。由于考虑到语音的生成过程来提取这些参数，因此预计将有效地作为辅助特征工作。在实验中，MercepStrum Vocoder的质量是针对性的，并且通过SNR（信噪比比）和SDR（信号 - 失真率）的两个指示器客观地评估合成语音的质量。由于实验结果，已经证实了对SNR的显着改善，确认了所提出的方法的有效性。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2016年第477期|共6页
作者
玉森聡; 林知樹; 戸田智基; 武田一哉;
展开▼
作者单位

名古屋大学未来社会創造機構;

名古屋大学大学院情報科学研究科;

名古屋大学情報基盤センター;

名古屋大学大学院情報科学研究科;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
WaveNet; 畳み込みニューラルネットワーク; ソースフィルタモデル; メルケプストラム; 基本周波数;

机译：wavenet;卷积神经网络;源滤波器模型;Mercepstrum;基本频率;

相似文献

外文文献
中文文献
专利

1. 音声生成過程を考慮したWaveNetに基づく音声波形合成法 [J] . 玉森聡, 林知樹, 戸田智基, 電子情報通信学会技術研究報告. 音声. Speech . 2016,第477期

机译：基于Wavenet考虑语音生成过程的语音波形综合方法
2. 音声生成過程を考慮したWaveNetに基づく音声波形合成法 [J] . 玉森聡, 林知樹, 戸田智基, 電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2016,第476期

机译：基于Wavenet考虑语音生成过程的语音波形综合方法
3. 音声生成過程を考慮したWaveNetに基づく音声波形合成法 [J] . 玉森聡, 林知樹, 戸田智基, 電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics . 2016,第475期

机译：基于Wavenet考虑语音生成过程的语音波形综合方法
4. 入力SNR を考慮した音声存在確率に基づく単一チャネル雑音スペクトル推定 [C] . 河中昌樹, 宇根昌和, 宮崎亮一日本音響学会2019年春季研究発表会講演論文集 . 2019

机译：考虑输入信噪比的基于语音存在概率的单通道噪声频谱估计
5. 軟口蓋と声道壁の振動を考慮した音声生成機構の音響モデルに関する研究 [D] . 党建武 1992

机译：考虑软pa和声道壁振动的语音产生机制的声学模型研究
6. 距離減衰式に基づく断層破壊過程を考慮した地震動予測に関する研究 [O] . 王寺秀介 2012

机译：基于距离衰减公式的考虑断裂过程的地震运动预测研究

音声生成過程を考慮したWaveNetに基づく音声波形合成法

摘要

著录项

相似文献

相关主题

期刊订阅