【24h】

意味属性を利用したクラスN-gram言語モデルの評価

机译:使用语义属性评估N-Gram语言模型的评估

获取原文
获取原文并翻译 | 示例
           

摘要

一般に,クラスN-gram言語モデルは(1)小規模コーパスで学習ができる,(2)未知語への対策が容易に行えるなどの利点を持つが,認識性能の観点からは改善が少ない.本報告では,日本語語嚢大系中の意味属性をクラス情報として用いたクラスN-gram言語モデルの評価結果を報告する.提案方式は(1)学習コーパス中に現れる名詞を,日本語語義大系を元に意味属性と対応付け,(2)日本語語秦大系に出現しない単語を,分類対象外単語クラスとして一つのクラスにまとめることで,クラスN-gramを構築する.本方式は,体系化された意味属性を用いるため,パープレキシティなどに基づく自動クラスタリングと比較して,モデル構築時間が格段に低減する.評価では,まず,通常の単語N甘amと提案のクラスN-gramモデルとの比較を行う.次に,クラスタリング手法に関する比較検討を行った後,意味属性を初期クラスとした自動クラスタリングの性能評価を行う.提案方式は,対話音声を対象とした音声認識実験で性能を大きく改善すると共に,クラスタリングにかかる彪大な計算を不要とする.
机译:通常,可以在小规模的语料库(2)中学习类别的n-gram语言模型,但是能够容易地对未知词采取措施的优点,但是从识别性能的角度来看几乎没有改善。在本报告中,我们在日语SAC科学系统中使用日语SAC科学系统中的语义属性报告类别n-gram语言模型的评估结果。所提出的方法是(1)出现在学习语料库中的名词,一个语义属性和与日语学校系统的联系,(2)日语大大一度通过组合成一个级别的n-gram班级。在该方法中,由于使用系统化的语义属性,与基于PUPP词典等的自动聚类相比,模型施工时间显着降低。在评估中,首先,执行正常的单词N SWEET AM和所提出的N-GRAM模型的比较。接下来,在比较群集方法之后,使用语义属性作为初始类执行自动聚类的性能评估。该方法大大提高了针对互动演讲的语音识别实验中的性能,并消除了对聚类的oP合理计算的需求。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号