首页> 外文期刊>情報処理学会論文誌 >道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価
【24h】

道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価

机译:基于概念语音合成的定向语音对话系统响应生成方法的实现与评估

获取原文
获取原文并翻译 | 示例
       

摘要

Due to advancements on speech and language processing, a number of spoken dialogue systems have been constructed. However, since most of them adopt existing text-to-speech synthesizers to generate output speech, it is rather difficult to reflect all the linguistic information obtained during the reply sentence generation. In order to solve this situation, a framework is necessary for correctly reflecting higher-level linguistic information, such as syntactic structure and discourse information, on the prosody of output speech: concept-to-speech conversion, where reply sentences are generated from information (to be transmitted) and converted into speech in a unified process. We have constructed a spoken dialogue system on road guidance, and, in the system, realized concept-to-speech synthesis. The linguistic information of the generated sentence is handled in tag LISP form to keep the syntactic structures throughout the process. By this way, the linguistic information can be properly reflected on the prosody of output speech. Furthermore, by making it possible to insert not only words but also phrase templates in tags, various sentences were generated with minor increase of templates. Results of listening experiment and evaluation of sentence generation efficiency showed the validity of the method developed as above.%音声認識·合成をはじめとする音声·言語処理の進展にともない,多くの音声対話システムが構築されている.しかしながら,それらの多くは,音声合成部に既存のテキスト音声合成器(ソフトウェア)を用いているため,応答文生成の過程で得られる言語情報を良好に音声出力に反映させることが困難である.音声対話システムの応答音声は,場面に即した内容の文を適切に音声化したものであることが要求される.そのためには,統語構造や談話情報等の高次の言語情報を正しく韻律に反映させることのできる枠組みが必要であり,したがって,伝達する情報から文を生成し,音声を合成する,概念音声合成の実現が求められる.我々は,応答音声を概念音声合成によって行う道案内音声対話システムを構築し,その中で,文生成に関わる言語情報を,構文木構造を保持したまま取り扱う手法を開発した.応答生成のための言語情報の取扱い手法として,情報スロットをタグで表現したLISP形式のテンプレートを用意することで,統語構造や談話情報等の高次の言語情報を適切に韻律に反映させる手法を実現した.また,タグに単語だけでなく連文節の定型フレーズも挿入できるようにし,より柔軟で汎用的な応答文生成を実現した.実験·検証により,堤案手法の有効性が確かめられた.
机译:由于语音和语言处理方面的进步,已经建立了许多口头对话系统。但是,由于它们中的大多数采用现有的文本语音合成器来生成输出语音,因此很难反映出在生成应答句子时获得的所有语言信息。为了解决这种情况,需要一个框架来正确反映高级语言信息(例如句法结构和语篇信息)对输出语音的韵律:概念到语音的转换,其中从信息生成回复句子(待传输)并在统一的过程中转换为语音。我们构建了关于道路导航的口语对话系统,并在系统中实现了概念到语音的综合。生成的句子的语言信息以标签LISP形式处理,以在整个过程中保持语法结构。通过这种方式,语言信息可以适当地反映在输出语音的韵律上。此外,通过使不仅可以在标签中插入单词而且还可以在短语中插入短语模板,从而在模板的少量增加的情况下生成了各种句子。听力实验的结果和句子生成效率的评估表明,上述方法是有效的。 ,それらの多くは,音声合成部に既存のテキスト音声合成器(ソフトウェア)を用いているため,応答文生成の过程で得られる言语情报を良好に音声出力に反映させることが困难である。そ话システムの応答音声は,场面に即した内容の文を适切に音声化したものであることが要求される。そのためには,统语构造や个性情报等の高次の言语情报を正しく韵律に反映々はとのできる枠组みが必要であり,したがって,伝达する情报から文を生成し,音声を合成する,概念音声合成の実现が求められる。我々は,応答音声を概念音声合成によって行う道案案内音声対话応ステムを构筑し,その中で,文生成に关わる言语情报を,构文木构造を保持したまま取り扱う手法を开発した。応答生成のための言语情报の取扱い手法として,情报スロットをタグで表现をタグでLISP形式のテンプレートを用意することで,统语构造や个性情报等の高次の言语情报を适切に韵律に反映に手法を実现した。した,タグに単语だけでなく连文节の定型フレーズも插入できるようにし,より柔软で泛用的な応答文生成を実现した。実験·検证により,堤案手法の有效が确かめられた。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号