道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価

八木　裕司; 高田　靖也; 広瀬　啓吉; 峯松　信明

首页> 外文期刊>情報処理学会論文誌 >道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価

【24h】

道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価

机译：基于概念语音合成的定向语音对话系统响应生成方法的实现与评估

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Due to advancements on speech and language processing, a number of spoken dialogue systems have been constructed. However, since most of them adopt existing text-to-speech synthesizers to generate output speech, it is rather difficult to reflect all the linguistic information obtained during the reply sentence generation. In order to solve this situation, a framework is necessary for correctly reflecting higher-level linguistic information, such as syntactic structure and discourse information, on the prosody of output speech: concept-to-speech conversion, where reply sentences are generated from information (to be transmitted) and converted into speech in a unified process. We have constructed a spoken dialogue system on road guidance, and, in the system, realized concept-to-speech synthesis. The linguistic information of the generated sentence is handled in tag LISP form to keep the syntactic structures throughout the process. By this way, the linguistic information can be properly reflected on the prosody of output speech. Furthermore, by making it possible to insert not only words but also phrase templates in tags, various sentences were generated with minor increase of templates. Results of listening experiment and evaluation of sentence generation efficiency showed the validity of the method developed as above.%音声認識·合成をはじめとする音声·言語処理の進展にともない，多くの音声対話システムが構築されている．しかしながら，それらの多くは，音声合成部に既存のテキスト音声合成器（ソフトウェア）を用いているため，応答文生成の過程で得られる言語情報を良好に音声出力に反映させることが困難である．音声対話システムの応答音声は，場面に即した内容の文を適切に音声化したものであることが要求される．そのためには，統語構造や談話情報等の高次の言語情報を正しく韻律に反映させることのできる枠組みが必要であり，したがって，伝達する情報から文を生成し，音声を合成する，概念音声合成の実現が求められる．我々は，応答音声を概念音声合成によって行う道案内音声対話システムを構築し，その中で，文生成に関わる言語情報を，構文木構造を保持したまま取り扱う手法を開発した．応答生成のための言語情報の取扱い手法として，情報スロットをタグで表現したLISP形式のテンプレートを用意することで，統語構造や談話情報等の高次の言語情報を適切に韻律に反映させる手法を実現した．また，タグに単語だけでなく連文節の定型フレーズも挿入できるようにし，より柔軟で汎用的な応答文生成を実現した．実験·検証により，堤案手法の有効性が確かめられた．

机译：由于语音和语言处理方面的进步，已经建立了许多口头对话系统。但是，由于它们中的大多数采用现有的文本语音合成器来生成输出语音，因此很难反映出在生成应答句子时获得的所有语言信息。为了解决这种情况，需要一个框架来正确反映高级语言信息（例如句法结构和语篇信息）对输出语音的韵律：概念到语音的转换，其中从信息生成回复句子（待传输）并在统一的过程中转换为语音。我们构建了关于道路导航的口语对话系统，并在系统中实现了概念到语音的综合。生成的句子的语言信息以标签LISP形式处理，以在整个过程中保持语法结构。通过这种方式，语言信息可以适当地反映在输出语音的韵律上。此外，通过使不仅可以在标签中插入单词而且还可以在短语中插入短语模板，从而在模板的少量增加的情况下生成了各种句子。听力实验的结果和句子生成效率的评估表明，上述方法是有效的。，それらの多くは，音声合成部に既存のテキスト音声合成器（ソフトウェア）を用いているため，応答文生成の过程で得られる言语情报を良好に音声出力に反映させることが困难である。そ话システムの応答音声は，场面に即した内容の文を适切に音声化したものであることが要求される。そのためには，统语构造や个性情报等の高次の言语情报を正しく韵律に反映々はとのできる枠组みが必要であり，したがって，伝达する情报から文を生成し，音声を合成する，概念音声合成の実现が求められる。我々は，応答音声を概念音声合成によって行う道案案内音声対话応ステムを构筑し，その中で，文生成に关わる言语情报を，构文木构造を保持したまま取り扱う手法を开発した。応答生成のための言语情报の取扱い手法として，情报スロットをタグで表现をタグでLISP形式のテンプレートを用意することで，统语构造や个性情报等の高次の言语情报を适切に韵律に反映に手法を実现した。した，タグに単语だけでなく连文节の定型フレーズも插入できるようにし，より柔软で泛用的な応答文生成を実现した。実験·検证により，堤案手法の有效が确かめられた。

著录项

来源
《情報処理学会論文誌》 |2007年第9期|p.3300-3308|共9页
作者
八木　裕司; 高田　靖也; 広瀬　啓吉; 峯松　信明;
展开▼
作者单位

東京大学大学院工学系研究科;

展开▼
收录信息美国《科学引文索引》(SCI);
原文格式 PDF
正文语种 jpn
中图分类计算技术、计算机技术;
关键词

相似文献

外文文献
中文文献
专利

1. 質問応答データベースの自動作成に基づく音声対話システムの評価 [J] . 森本高弘, 伊藤仁, 鈴木基之, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第338期

机译：基于问答数据库自动创建的语音对话系统评估
2. 質問応答データベースの自動作成に基づく音声対話システムの評価 [J] . 森本高弘, 伊藤仁, 鈴木基之, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2008,第337期

机译：基于问答数据库自动创建的语音对话系统评估
3. 質問応答データベースの自動作成に基づく音声対話システムの評価 [J] . 森本　高弘, 伊藤　仁, 鈴木　基之, 電子情報通信学会技術研究報告 . 2008,第338期

机译：基于问答数据库自动创建的语音对话系统评估
4. 対話相手への好感に基づく発話構成要素の選択とお見合い対話システムへの実装 [C] . 田中滉己, 井上昂治, 中村静, 情報処理学会;情報処理学会全国大会 . 2019

机译：根据对话伙伴的良好印象选择话语成分，并在配对对话系统中实现
5. 音声応答生成のための対話処理と音声合成に関する研究利用統計を見る [D] . 浅野康治 1993

机译：有关用于语音响应生成的对话处理和语音合成的研究，请参阅用法统计
6. 話者照合システムに対する音声合成法に基づくウルフ攻撃とその対策に関する研究 [O] . 林祥平 2013

机译：基于语音合成方法的Wolf攻击研究及其说话人验证系统的对策

道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価

摘要

著录项

相似文献

相关主题

期刊订阅