【24h】

情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

机译:基于信息量的PLSA语言模型对主题/句子模式的适应

获取原文
获取原文并翻译 | 示例
           

摘要

PLSAは言語モデルの文脈適応に一般的に用いられる手法である.このPLSAの新しい利用方法を提案する.PLSA言語モデルの語彙をr話題語」「文型語」「汎用語」の3クラスに分割し,話題語PLSAモデルと文型語PLSAモデルを別々に学習·適応した後に3つのモデルを統合する.また新聞記事とCSJ間での品詞分類の出現パターン変化に基づいた,語彙分割基準の自動生成を提案する.評価実験では話題と文型の特徴が学習データで共起していないテキストについて,従来のPLSA言語モデルと比べ15.48%のperplexity削減が得られた.
机译:PLSA是语言模型的上下文适应的常用方法。我们提出了一种使用PLSA的新方法,将PLSA语言模型的词汇分为三个类别,即r个主题词,句子模式词和通用词,分别学习和改编主题词PLSA模型和句子模式词PLSA模型。之后,将三个模型集成在一起。我们还建议根据报纸文章和CSJ之间部分单词分类的出现模式的变化自动生成词汇划分标准。在评估实验中,与传统的PLSA语言模型相比,训练数据中主题和句子模式的特征不共存的文本的困惑度降低了15.48%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号