日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価

郡山　知樹; 能勢　隆; 小林　隆夫

首页> 外文期刊>電子情報通信学会技術研究報告 >日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価

【24h】

日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価

机译：使用日语口语语料评估对话语音合成的上下文

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では自発性の高い対話音声の合成において，多様な親律を生成するための拡張コンテキストの提案とその評価を行った結果を報告する．HMM 音声合成では音韻．韻律の変動要因をコンテキストとして考慮し学習・合成を行っているが，従来の読上げ音声のためのコンテキストセットでは対話音声の韻律の多様性を実現することが困難である，そこで，大規模音声コーパスである日本語話し言葉コーパス（CSJ）に含まれる様々な情報をコンテキストとして追加し拡張コンテキストとした．従来のコンテキストと拡張コンテキストの比較を行い，音素引き延ばしおよびX-JTbBI のトーン層ラベルに基づく情報がコンテキストとして有効であるという結果を得た．さらに．コンテキストの増加による遇学習を避けるための決定木クラスタリングの新たな停止基準の導入や，実用上のシステムを考慮して合成時に一部の追加コンテキストを自動推定する手法の提案を行い，その有効性を評価した．%This paper proposes an extended context set for generating the prosodic variability of spontaneous speech in HMM-based conversational speech synthesis. Since the conventional context set used for HMM-based reading-style speech synthesis is insufficient for conversational speech synthesis, we introduce new contexts derived from the Corpus of Spontaneous Japanese. We compare the context sets with and without newly introduced contexts, and the experimental results show that the contexts about phone prolongation and X-JToBI tone tier label are effective. Furthermore, we examine the stopping criteria for decision-tree clustering and the automatic estimation of a part of contexts for practical applications.

机译：在本文中，我们报告了一个提议的结果，以及对扩展上下文的评估，该扩展上下文用于在高度自发的语音合成中生成各种掌握规则。 HMM语音合成中的音素。尽管以韵律变化因子为语境进行学习和综合，但是利用用于阅读语音的常规语境设置来实现会话语音的韵律多样性是困难的。日本口语语料库（CSJ）中包含的各种信息。我们比较了常规上下文和扩展上下文，并获得了基于X-JTbBI音调层标签的音素扩展和信息作为上下文有效的结果。进一步。为决策树聚类引入新的停止准则，以通过增加上下文数量来避免学习，并提出一种在考虑实际系统及其有效性的情况下，在合成过程中自动估算一些其他上下文的方法被评估。本文提出了一个扩展的上下文集，用于在基于HMM的会话语音合成中生成自发语音的韵律变异性；由于用于基于HMM的阅读式语音合成的常规上下文集不足以进行会话语音合成，因此我们引入了新的上下文我们导出了带有或不带有新引入上下文的上下文集，实验结果表明，有关电话延长和X-JToBI音调等级标签的上下文是有效的。 -树聚类以及针对实际应用的部分上下文的自动估计。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第27期|p.155-160|共6页
作者
郡山　知樹; 能勢　隆; 小林　隆夫;
展开▼
作者单位

東京工業大学大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

東京工業大学大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

東京工業大学大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
対話音声; 話し言葉音声; HMM 音声合成; 韻律コンテキスト; 日本語話し言葉コーパス; X-JTbBI;

机译：对话语音;口语语音;HMM语音合成;韵律语境;日语口语语料库;X-JTbBI;

相似文献

外文文献
中文文献
专利

1. 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 [J] . 郡山知樹, 能勢隆, 小林隆夫電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2011,第27期

机译：使用日语语料库评估对话语音合成的上下文
2. 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 [J] . 郡山知樹, 能勢隆, 小林隆夫電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics . 2011,第26期

机译：使用日语语料库评估对话语音合成的上下文
3. 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 [J] . 郡山知樹, 能勢隆, 小林隆夫電子情報通信学会技術研究報告. 音声. Speech . 2011,第28期

机译：使用日语语料库评估对话语音合成的上下文
4. Sequence-to-Sequence model を用いた話し言葉音声認識用言語モデルのための書き言葉から話し言葉へのテキスト変換 [C] . 小橋優矢, 西村良太, 北岡教英日本音響学会研究発表会 . 2019

机译：使用序列到序列模型的语言模型的语言模型的文本转换
5. 非タスク指向型対話システムでの話題同定のためのコーパス構築に関する研究 [D] . 柴田尚樹, /シバタヒサキ 2019

机译：非任务对话系统中主题识别的语料库构建研究
6. 経験を語る談話における接続語の使用：『わたしのちょっと面白い話コンテスト』コーパスを資料とした考察 [O] . 長谷川哲子, Noriko Hasegawa 2017

机译：在谈论经验的话语中使用连接词：使用“我的小搞笑大赛”语料库的研究

日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価

摘要

著录项

相似文献

相关主题

期刊订阅