首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >言語情報とF0情報を利用したアクセント句境界の自動推定
【24h】

言語情報とF0情報を利用したアクセント句境界の自動推定

机译:使用语言信息和F0信息自动估计重音短语边界

获取原文
获取原文并翻译 | 示例
       

摘要

音声合成手法の開発·評価するための音声データには,アクセントなどに関する韻律情報ラベルが不可欠である。本研究では,音声データラベリングにおけるアクセント句境界を自動推定する手法について述べる。発話内容と音素ラベルが既知の条件のもと,言語モデルとF0モデルに基づき境界の自動推定を行う。言語モデルに基づく推定にはCRF,F0モデルに基づく推定には多次元正規分布を用いる。また,アクセント句境界の仮説を立てて,先行アクセント句境界からの累積モーラ数を利用することで推定精度の向上を試みる。累積モーラ数を利用してアクセント句境界の自動推定を行うことにより,読み上げ音声であるATR503文において精度の向上が確認できた。
机译:与口音相关的节奏信息标签对于开发和评估语音合成方法的语音数据是必不可少的。在这项研究中,我们描述了一种自动估计语音数据标签中口音短语边界的方法。在语音内容和语音标签已知的条件下,基于语言模型和F0模型自动估计边界。 CRF用于基于语言模型的估计,多维正态分布用于基于F0模型的估计。另外,我们尝试通过对重音短语边界进行假设并使用前一个重音短语边界的累积次数来提高估计准确性。通过使用累计的次数来自动估计重音短语边界,可以确认提高了朗读语音的ATR503句子的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号