首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >意味属性を利用したクラスN-gram言語モデルの評価
【24h】

意味属性を利用したクラスN-gram言語モデルの評価

机译:使用语义属性评估类N-gram语言模型

获取原文
获取原文并翻译 | 示例
           

摘要

一般に,クラスN-gram言語モデルは(1)小規模コーパスで学習ができる,(2)未知語への対策が容易に行えるなどの利点を持つが,認識性能の観点からは改善が少ない.本報告では,日本語語彙大系中の意味属性をクラス情報として用いたクラスN-gram言語モデルの評価結果を報告する.提案方式は(1)学習コーパス中に現れる名詞を,日本語語彙大系を元に意味属性と対応付け,(2)日本語語彙大系に出現しない単語を,分類対象外単語クラスとして一つのクラスにまとめることで,クラスN-gramを構築する.本方式は,体系化された意味属性を用いるため,パープレキシティなどに基づく自動クラスタリングと比較して,モデル構築時間が格段に低減する.評価では,まず,通常の単語N-gramと提案のクラスN-gramモデルとの比較を行う.次に,クラスタリング手法に関する比較検討を行った後,意味属性を初期クラスとした自動クラスタリングの性能評価を行う.提案方式は,対話音声を対象とした音声認識実験で性能を大きく改善すると共に,クラスタリングにかかる彪大な計算を不要とする.
机译:通常,类N-gram语言模型具有以下优点:(1)语料库小,学习(2)针对未知单词的简单对策,但是从识别性能的角度来看,改进很少。在此报告中,我们报告了使用日语词汇系统中的语义属性作为类信息的N类语法模型的评估结果。在所提出的方法中,(1)基于日语词汇系统将出现在学习语料库中的术语与语义属性相关联,并且(2)将未出现在日语词汇系统中的单词分类为一个未分类的单词类别。通过将N-gram分组为类来构造它们。由于此方法使用系统的语义属性,因此与基于困惑的自动聚类相比,模型的构建时间显着减少。在评估中,我们首先将正常单词N-gram与建议的N-gram类模型进行比较。接下来,在对聚类方法进行比较研究之后,评估以语义属性为初始类的自动聚类的性能。所提出的方法大大提高了交互式语音的语音识别实验的性能,并且消除了与聚类有关的大量计算的需要。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号