【24h】

HMM音声合成における共分散パラメータの共有に関する検討

机译:HMM语音合成中协方差参数共享的检查

获取原文
获取原文并翻译 | 示例
           

摘要

本報告では隠れマルコフモデル(Hidden Markov Model; HMM)に基づく音声合成システムにおける共分散パラメータの共有について述べる.近年,音声合成システムへの需要が高まっており,HMMに基づいた音声合成システムでは音声波形の断片をそのまま利用するのではなく,音声波形の特徴をHMMによりモデル化し,HMMのモデルパラメータを合成システムに保持するため,同程度の音質の波形接続法式に比べてフットプリントが小さい利点がある.中でも組み込み向けのシステムには携帯電話,PDA,カーナビ,情報家電,ゲーム機等への用途があるが,必要なCPU,メモリ等が制限されることが多く,更なるフットプリントの縮小が必要である.HMMに基づく音声合成システムにコンテキスト依存モデルを用いることで高精度な音響モデルを構築することができ,決定木に基づくコンテキストクラスタリングを用いて状態共有構造を構築する際に,組み込み用途向けに決定木のサイズを小さくすることも考えられるが,音質が劣化する.本報告では,平均に比べて共分散が音質に与える影響が小さいことに注目し,全てのパラメータの共分散を共有する手法を提案する.このパラメータ共有を仮定した上でのコンテキストクラスタリングを行い,主観評価実験により,パラメータ数を大幅に削減するのみならず,若干の品質改善を達成した.
机译:在这份报告中,我们描述了基于隐马尔可夫模型(HMM)的语音合成系统中协方差参数的共享。近年来,对语音合成系统的需求不断增长,在基于HMM的语音合成系统中,不是直接使用语音波形片段,而是通过HMM对语音波形的特征进行建模,并合成HMM的模型参数。它的优点是其占用空间比具有类似音质的波形连接方法的占用空间小。其中,嵌入式系统具有诸如手机,PDA,汽车导航系统,家庭信息设备,游戏机等的应用,但是所需的CPU,内存等通常受到限制,因此有必要进一步减少占用空间。在那儿。当使用基于决策树的上下文聚类构造状态共享结构时,可以通过使用基于上下文的用于HMM的语音合成系统的上下文相关模型和用于嵌入式应用程序的决策树来构建高精度的声学模型。尽管可以减小其尺寸,但是声音质量会下降。在本报告中,我们关注协方差对声音质量的影响小于平均值的事实,并提出了一种共享所有参数协方差的方法。在这种参数共享的假设下进行了上下文聚类,主观评估实验不仅显着减少了参数数量,而且还实现了一些质量改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号