ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築

翠　輝久; 河原　達也

首页> 外文期刊>電子情報通信学会論文誌. D, 情報、システム >ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築

【24h】

ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築

机译：考虑域和样式的网络文本选择语音对话系统语言模型的构建

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

音声対話システムにおいて，ユーザの多様な発話を頑健に認識するためには，タスクドメインに合致した十分な量のテキストデータでN-gram言語モデルを構築することが望ましい．しかし，新たに音声対話システムを作成する際に，ユーザが人力すると想定される発話を大量に用意することは困難である．そこで本論文では，Webから学習データを収集・選択することにより効率的に言語モデルを構築する手法を提案する．Webの検索クエリは，対話システムが対象とするドメインについて記述された文書から作成する．これにより検索・収集されたWebテキストの多くは，対話システムのユーザの発話スタイルとマッチしたものではなく，言語モデルの学習データとしてこれらのすべてを使用するのは適切でない．そこで，別の対話システムで収集されたユーザ発話コーパスを併用することで，発話スタイルの近い文を選択する．ソフトウェアサポートと観光案内の二つのドメインにおいて評価を行った結果，パープレキティ及び音声認識精度の有意な改善が得られた．また実験結果の分析により，Webテキストを選択する際に，文のスタイルを考慮することの重要性が確認された．

机译：为了在语音对话系统中可靠地识别用户的各种话语，期望构造具有与任务域匹配的足够数量的文本数据的N-gram语言模型。但是，在创建新的口语对话系统时，很难准备大量应该由人为操作的讲话。在本文中，我们提出了一种通过从Web上收集和选择学习数据来有效构建语言模型的方法。 Web搜索查询是从描述交互式系统目标域的文档中创建的。通过这种方法检索和收集的大多数Web文本与对话系统用户的发声风格都不匹配，因此不适合将所有这些文本用作语言模型的学习数据。因此，通过使用由另一对话系统收集的用户话语语料库，选择具有相似话语风格的句子。作为在两个方面的评估的结果，软件支持和游客信息，在困惑度和语音识别准确性方面获得了显着改善。此外，对实验结果的分析证实了选择Web文本时考虑句子样式的重要性。

著录项

来源
《電子情報通信学会論文誌. D, 情報、システム》 |2007年第11期|p.3024-3032|共9页
作者
翠　輝久; 河原　達也;
展开▼
作者单位

京都大学大学院情報学研究科;

京都市;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类无线电电子学、电信技术;
关键词
音声認識; 言語モデル; 音声対話システム; Webテキスト選択;

机译：语音识别;语言模型;口语对话系统;Web文本选择;

相似文献

外文文献
中文文献
专利

1. ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築 [J] . 翠輝久, 河原達也, Teruhisa MISU, 電子情報通信学会論文誌, D. 情報·システム . 2007,第11期

机译：通过考虑域和样式来选择Web文本，为语音对话系统构建语言模型
2. ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築 [J] . 翠輝久, 河原達也, Teruhisa MISU, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2006,第442期

机译：通过考虑域和样式来选择Web文本，为交互式系统构建语言模型
3. ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築 [J] . 翠輝久, 河原達也, Teruhisa MISU, 電子情報通信学会技術研究報告. 音声. Speech . 2006,第444期

机译：通过考虑域和样式来选择Web文本，为交互式系统构建语言模型
4. ドメイン固有語の認識率向上を目指した音声対話システム用言語モデルの構築 [C] . 森祥二郎, 駒谷和範, 佐藤理史情報処理学会全国大会 . 2016

机译：语言对话系统语言模型的构建旨在提高域独特单词的识别率
5. 組織業績に貢献するように従業員の知識や経験を生かす管理会計システムの利用方法のレビュー : イネーブリング?コントロールを分析枠組みとした日本企業の管理会計システムの利用方法の考察 [D] . 三浦紘嵩 2020

机译：回顾如何使用利用员工的知识和经验对组织绩效做出贡献的管理会计系统：考虑如何将日本公司的管理会计系统与支持框架作为分析框架一起使用
6. 電力市場参加者モデルに関する研究：ファジイ推論システムを用いるエージェントモデルとリスク管理を考慮したエージェントモデルの提案 [O] . Zhi Guilan 2016

机译：电力市场参与者模型研究：使用模糊推理系统的Agent模型和考虑风险管理的Agent模型的建议

ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築

摘要

著录项

相似文献

相关主题

期刊订阅