...
首页> 外文期刊>電子情報通信学会技術研究報告 >重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法
【24h】

重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法

机译:基于多元回归HMM的语音估计语音模型中的声学模型学习方法

获取原文
获取原文并翻译 | 示例
           

摘要

We propose a technique for emotional speech recognition based on multiple-regression HMM (MRHMM). To achieve emotional speech recognition for an arbitrary speaker with a small amount of training data, we incorpo rate a speaker and style adaptation technique into speaker-dependent MRHMM-based emotional speech recognition. In the proposed technique, we first adapt the speaker-independent model to target speaker's respective styles with a small amount of speech data. Then, using obtained speaker- and style-adapted HMMs and low-dimensional style control vector for each training style, the regression matrices of MRHMM are estimated based on least square method and maximum likelihood estimation. We assess the performance of the proposed technique on the recogni tion of acted emotional speech uttered by both professional narrators and non-professional speakers and show the effectiveness of the technique.%本論文では,重回帰HMMに基づくスタイル推定を用いた音声認識手法において,この手法を容易に任意の話者へ適用することを目的に,重回帰HMMの学習に話者非依存モデルとモデル適応手法を導入する手法を提案する.提案法では,まず話者非依存モデルに目標話者の各スタイルの少量の適応データを用いて,話者性とスタイルの同時適応を行い,重回帰HMMの学習に用いる目標話者のスタイル適応HMMを作成する.得られたスタイル適応HMMのモデルパラメータと発話様式・感情表現(スタイル)の表出度合を表すスタイルベクトルから,最小二乗法により重回帰HMMの回帰行列を求め,最尤推定により補正を行う.プロのナレータと一般の発話者が発話した模擬感情音声に対して音素認識実験を行い,その結果から捷案法の性能評価を行う.また,提案法ではスタイル推定の結果から,認識結果だけでなく入力音声のスタイルも得られることを示す.
机译:我们提出了一种基于多元回归HMM(MRHMM)的情感语音识别技术。为了使用少量训练数据实现任意说话者的情感语音识别,我们将说话者和样式适应技术纳入了基于说话者的基于MRHMM的情感语音识别中。在提出的技术中,我们首先使用少量的语音数据将与说话者无关的模型改编为目标说话者的各自风格。然后,使用获得的适合说话者和样式的HMM和每种训练样式的低维样式控制向量,基于最小二乘法和最大似然估计来估计MRHMM的回归矩阵。我们评估了该技术对由专业叙述者和非专业发言人说出的情感性言语的识别性能,并证明了该技术的有效性。%本论文では,重回帰HMMに基づくスタイル推定を用いた音声认识手法において,この手法を容易に任意の话者へ适用することを目的に,重回帰HMMの学习に话者非依存モデルとモデル适応手法を导入する手法を推进する。者非依存モデルデ目标话者の各スタイルの少量の适応データを用いて,话者性とスタイルの同时适応を行い,重回帰HMMの学习に用いる目标话者のスタイル适応HMMを作成する。得MMスタイル适応HMMの默デルパラパラメータと発话様式・感情表现(スタイル)の表出度合を表すスタイルベクトルから,最小二乘法により重回帰HMMの回帰行列を求め,最尤推定定により补正を行う。プロのまたータと一般の発话者が発话した模拟感情音声に対して音素认识実験を行い,その结果から捷案法の性能评価を行う。また,逐步法ではスタイル推定の结果から,认识结果だけでなく入力音声のスタイルも得られることを示す。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号