首页> 外文期刊>電子情報通信学会技術研究報告 >言語情報とF0情報を利用したアクセント句境界の自動推定
【24h】

言語情報とF0情報を利用したアクセント句境界の自動推定

机译:使用语言信息和F0信息自动估计重音短语边界

获取原文
获取原文并翻译 | 示例
       

摘要

Speech synthesis techniques require speech data which is annotated with labels concerning prosodic information. This paper describes a method of automatic labeling of prosodic information focusing on accent phrase boundaries. A probabilistic model using both linguistic and prosodic information predicts the boundaries under the condition that the contents of speech and phoneme labels are given. We use CRF and multidimensional normal distribution for the linguistic probability model and the FO probability model, respectively. We try to improve accuracy of the accent phrase boundary prediction using the cumulative mora count from the proceeding accent phrase boundary. The cumulative mora count is calculated by making hypotheses of the accent phrase boundaries. Evaluation experiments show that the cumulative mora count improves accuracy of accent phrase boundary prediction for read speech of ATR503 sentences.%音声合成手法ゐ開発・評価するための音声データには,アクセントなどに関する韻律情報ラベルが不可欠である。本研究では,音声データラベリングにおけるアクセント句境界を自動推定する手法について述べる。発話内容と音素ラベルが既知の条件のもと,言語モデルとF0モデルに基づき境界の自動推定を行う。言語モデルに基づく推定にはCRF,F0モデルに基づく推定には多次元正規分布を用いる。また,アクセント句境界の仮説を立てて,先行アクセント句境界からの累積モーラ数を利用することで推定精度の向上を試みる。累積モーラ数を利用してアクセント句境界の自動推定を行うことにより,読み上げ音声であるATR503文において精度の向上が確認できた。
机译:语音合成技术需要语音数据,该语音数据带有与韵律信息有关的标签。本文介绍了一种针对重音短语边界的韵律信息自动标记方法。在给出语音和音素标签内容的条件下,同时使用语言信息和韵律信息的概率模型可以预测边界。我们分别将CRF和多维正态分布用于语言概率模型和FO概率模型。我们尝试使用来自进行中的重音短语边界的累积摩拉计数来提高重音短语边界预测的准确性。累积摩拉数是通过对重音短语边界进行假设来计算的。评估实验表明,累积的摩拉计数提高了ATR503句子朗读语音的重音短语边界预测的准确性。%音声合成手法ゐ开発・评判の音声データには,アクセントなどに关する韵律情报ラベルが不可欠である。研究では,音声データラタリベングにおけるアクセント语法境界を自动推定する手法について述べる。また,CRF,F0モデルに基基づく推定には多次元距离分布を用いる。累积モーラ数を利用してアクセント语法境界の自动推定を行うことにより,読み上げ音声であるATR503文において精度の向上が确认できた。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号