首页> 外文会议>電子情報通信学会;情報科学技術フォーラム >統計的歌声合成の音素タイミングモデル構築に向けた歌唱データベースの統計解析
【24h】

統計的歌声合成の音素タイミングモデル構築に向けた歌唱データベースの統計解析

机译:歌唱数据库构建统计歌唱语音合成的统计分析

获取原文

摘要

歌声合成とは歌詞と譜面を入力すると歌声波形を生成する技術の総称であり,代表的な歌声合成ソフトウェアであるVOCALOID [1]の発売後は,多くのクリエイタが歌声合成ソフトウェアを活用したコンテンツを公開している.歌声合成は,テキストから音声を生成するテキスト音声合成と類似した技術で構成されており,初期のアルゴリズムにはUnit selection [2]が用いられてきた.テキスト音声合成に関しては,その後,HMM (hidden Markov model)による統計的パラメトリック音声合成[3]が提案され,Unit selection よりも相対的に少ない学習データから,読み上げ内容を理解できる程度に自然な音声が生成可能となった.2013 年には,DNN (Deep neural network)を用いたテキスト音声合成 [4]が発表され,2017 年に提案されたTacotron [5]をはじめとするEnd-to-End 方式により,人間の音声と等価な品質での音声合成が実現された.
机译:歌声合成生成,当你进入歌词和音乐歌唱声音波形它是一个通用术语VOCALOID发布后[1],许多创作者唱内容利用软件已被释放。歌曲语音合成是一个文本语音合成,从文本生成音频它由类似技术的初始算法单位选择[2]已被使用。文本语音合成此后,通过HMM统计(隐马尔可夫模型)参数语音合成[3]提出,单元选择了解从相对小的学习数据的读取内容自然语音可产生尽可能。在2013年,文本语音合成[4]使用DNN(深层的神经网络)据公布,包括TACOTRON [5]提出了2017年与相当于人的话音质量的端至端的方法的声音语音合成实现的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号