...
【24h】

情報量基準で語彙分割したPLSA言語モデルによる話題·文型適応

机译:主题,句型适应PLSA语言模型,这些模型已被信息卷除外

获取原文
获取原文并翻译 | 示例
           

摘要

PLSAは言語モデルの文脈適応に一般的に用いられる手法である.このPLSAの新しい利用方法を提案する.PLSA言語モデルの語彙をr話題語」「文型語」「汎用語」の3クラスに分割し,話題語PLSAモデルと文型語PLSAモデルを別々に学習·適応した後に3つのモデルを統合する.また新聞記事とCSJ間での品詞分類の出現パターン変化に基づいた,語彙分割基準の自動生成を提案する.評価実験では話題と文型の特徴が学習データで共起していないテキストについて,従来のPLSA言語モデルと比べ15.48%のperplexity削減が得られた.
机译:PLSA是一种常用于语言模型的上下文适应的方法。 提出了一种新的PLSA的使用方法。将PLSA语言模型的词汇分为3类R-主题,“Seijin”和“一般术语”,并在此之后单独学习和调整无状态PLSA模型,整合三种型号。 我们还根据报纸文章和CSJ之间的语音分类变化,自动生成词汇划分标准。 在评估实验中,主题和特征特征在不共同发生学习数据的情况下没有共同发生,与传统的PLSA语言模型相比,获得了10.48%的困惑减少。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号