情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

栗山直人; 鈴木基之; 伊藤彰則; 牧野正三; Naoto KURIYAMA; Motoyuki SUZUKI; Akinori ITO; Shozo MAKINO

首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

【24h】

情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

机译：基于信息量的PLSA语言模型对主题/句子模式的适应

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

PLSAは言語モデルの文脈適応に一般的に用いられる手法である．このPLSAの新しい利用方法を提案する.PLSA言語モデルの語彙をr話題語」「文型語」「汎用語」の3クラスに分割し，話題語PLSAモデルと文型語PLSAモデルを別々に学習·適応した後に3つのモデルを統合する．また新聞記事とCSJ間での品詞分類の出現パターン変化に基づいた，語彙分割基準の自動生成を提案する．評価実験では話題と文型の特徴が学習データで共起していないテキストについて，従来のPLSA言語モデルと比べ15．48％のperplexity削減が得られた．

机译：PLSA是语言模型的上下文适应的常用方法。我们提出了一种使用PLSA的新方法，将PLSA语言模型的词汇分为三个类别，即r个主题词，句子模式词和通用词，分别学习和改编主题词PLSA模型和句子模式词PLSA模型。之后，将三个模型集成在一起。我们还建议根据报纸文章和CSJ之间部分单词分类的出现模式的变化自动生成词汇划分标准。在评估实验中，与传统的PLSA语言模型相比，训练数据中主题和句子模式的特征不共存的文本的困惑度降低了15.48％。

著录项

来源
《電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication》 |2006年第442期|共6页
作者
栗山直人; 鈴木基之; 伊藤彰則; 牧野正三; Naoto KURIYAMA; Motoyuki SUZUKI; Akinori ITO; Shozo MAKINO;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类通信;
关键词
言語モデル; PLSA; 話題適応; 話者適応; Language model; PLSA; Topic adaptation; Speaker adaptation;

机译：语言模型;PLSA;主题适应;说话者适应;语言模型;PLSA;主题适应;说话者适应;

相似文献

外文文献
中文文献
专利

1. 情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応 [J] . 栗山直人, 鈴木基之, 伊藤彰則, 電子情報通信学会技術研究報告. 音声. Speech . 2006,第444期

机译：基于信息量的PLSA语言模型对主题/句子模式的适应
2. 情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応 [J] . 栗山直人, 鈴木基之, 伊藤彰則, 電子情報通信学会技術研究報告. 音声. Speech . 2006,第444期

机译：主题，句型适应PLSA语言模型，这些模型已被信息卷除外
3. 情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応 [J] . 栗山直人, 鈴木基之, 伊藤彰則, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2006,第442期

机译：主题，句型适应PLSA语言模型，这些模型已被信息卷除外
4. 言語モデルによる文横断情報を用いたオーディオブック音声合成の検討 [C] . 中田　亘, 郡山　知樹, 高道　慎之介, 日本音響学会;日本音響学会研究発表会 . -1

机译：用语言模型使用翻译信息检查Audiobook语音合成
5. 会話分析による相互行為と語彙学習の関係の解明 : 日本語第一言語話者と第二言語話者のタスク活動の分析を通して [D] . 権賢貞, /クォンヒョンジョン 2019

机译：通过对话分析阐明互动和词汇学习之间的关系：通过分析日语第一和第二语言使用者的任务活动
6. WWWから得られる検索語重み付けと話題適応に基づく音声認識のための言語モデル [O] . 宮崎将隆 2010

机译：基于从WWW获得的搜索词加权和主题自适应的语音识别语言模型

情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

摘要

著录项

相似文献

相关主题

期刊订阅