首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >言語情報とF0情報を利用したアクセント句境界の自動推定
【24h】

言語情報とF0情報を利用したアクセント句境界の自動推定

机译:用语言和F0信息重音短语边界进行自动评估

获取原文
获取原文并翻译 | 示例
       

摘要

音声合成手法の開発·評価するための音声データには,アクセントなどに関する韻律情報ラベルが不可欠である。本研究では,音声データラベリングにおけるアクセント句境界を自動推定する手法について述べる。発話内容と音素ラベルが既知の条件のもと,言語モデルとF0モデルに基づき境界の自動推定を行う。言語モデルに基づく推定にはCRF,F0モデルに基づく推定には多次元正規分布を用いる。また,アクセント句境界の仮説を立てて,先行アクセント句境界からの累積モーラ数を利用することで推定精度の向上を試みる。累積モーラ数を利用してアクセント句境界の自動推定を行うことにより,読み上げ音声であるATR503文において精度の向上が確認できた。
机译:用于开发和评估语音合成方法的语音数据对于关于重点等的韵律信息至关重要。 在这项研究中,我们描述了在音频数据标签中自动估计重音短语界限的方法。 在已知话语内容和音素标签的条件下,基于语言模型和F0模型来执行边界的自动估计。 对于基于语言模型的估计,多维正常分布用于基于CRF和F0模型的估计。 此外,通过使用来自前一个重点短语边界的累积数量来提高估计精度的突出短语界限的假设。 通过使用累积莫拉的数量执行重音短语界限的自动估计,可以确认ATR 503句子的准确性改进,这是读取的声音。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号