首页> 外文期刊>東芝レビュー >次世代音声合成システムToSpeak V2を支える多様性向上技術
【24h】

次世代音声合成システムToSpeak V2を支える多様性向上技術

机译:支持下一代语音合成系统ToSpeak V2的多样性改善技术

获取原文
获取原文并翻译 | 示例
           

摘要

公共施設の情報端末や,コールセンターの自動応答,しゃべる家電など,生活のなかで音声サービスを耳にする機会が増えてきている。音声合成技術は,テキストを入力するだけで任意の音声を生成できるため,これらの音声コンテンツの作成に要していた費用や時間を大幅に削減でき,また,この結果として音声サービスのいっそうの普及も期待できる。東芝は,高い基本音質に加えて,様々なコンテンツに適したバリエーション豊かな声質や発話スタイルの合成音声の生成を実現するために,音声合成の多様化の研究を進めている。今回,様々な抑揚の特徴を精度よくモデル化できる新しい基本周波数制御手法と,任意の語句を強調できる韻律制御手法を開発した。これらの手法を導入して,幅広い用途に対応できる次世代の音声合成システムToSpeak V2を開発した。
机译:在我们的日常生活中,听到语音服务的机会越来越多,例如公共设施中的信息终端,呼叫中心的自动应答以及会说话的家用电器。由于语音合成技术仅通过输入文本即可生成任意语音,因此可以大大降低创建这些语音内容所需的成本和时间,结果,语音服务变得更加普及。也可以预期。除了具有较高的基本音质外,东芝还在进行语音合成的多样化研究,以实现具有多种语音质量和适用于各种内容的语音样式的合成语音的生成。这次,我们开发了一种新的基本频率控制方法,可以精确地模拟各种语调特征,而韵律控制方法可以强调任意单词。通过介绍这些方法,我们开发了下一代语音合成系统ToSpeak V2,可以在广泛的应用中使用。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号