首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音素別ニューラルネットワークを用いた調音-音響マッピング-パラメータ学習法の検討
【24h】

音素別ニューラルネットワークを用いた調音-音響マッピング-パラメータ学習法の検討

机译:使用神经网络对每个声音元素进行音调调整-声学映射-参数学习方法的检验

获取原文
获取原文并翻译 | 示例
       

摘要

本論では,発話内容に関する音素情報と,唇,顎,舌,軟口蓋等の調音器官の運動軌道から,声道スペクトル特性を推定する方法について述べる.本推定法では,音素別に構成されたニューラルネットワークによる調音-音響マッピング関数を用いる.音素環境により選択される音素別ニューラルネットワークに調音位置を入力すると,音素依存スペクトルが出力され,調音次元での距離に基づいて連続する音素間でそれらを補間することで,最終的な声道スペクトル特性が推定きれる.学習時には,音素依存スペクトルの補間を考慮し,各音素の調音時点のデータに加えて,調音時点間に存在するデータもパラメータの学習に用いる.本推定法によるスペクトル推定実験を行った結果,スペクトル歪は3.15dBとなった.
机译:在本文中,我们描述了一种从语音信息中估计语音通道频谱特征的方法,该语音信息与语音内容以及诸如嘴唇,下巴,舌头和软pa等音调器官的运动轨迹有关。该估计方法通过为每个语音元素配置的神经网络使用音-声映射功能。当将音调位置输入到由音调元素环境选择的特定于音调元素的神经网络时,将输出与音调元素相关的频谱,并根据音调调整维度中的距离(即最终的语音路径频谱)在连续的音调元素之间进行插值。可以估计特性。在学习时,考虑到语音相关频谱的内插,除了每个语音的调音时的数据之外,在调音时之间存在的数据也用于参数学习。通过该估计方法进行频谱估计实验的结果是,频谱失真为3.15dB。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号