首页> 外文期刊>人工知能学会論文誌 >言葉の意味の類似性判別に関するシソーラスと概念ベースの性能評価
【24h】

言葉の意味の類似性判別に関するシソーラスと概念ベースの性能評価

机译:基于词库和基于概念的绩效评估,相似性确定单词的单词

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

これらシソーラスや概念ベースの単語の意味の類似性に関する判別能力(以下,類似性判別能力)の評価は,これまで単独にかつ別々の尺度でなされてきており[平川03,笠原97,石川98],同一の尺度での比較評価はなされてこなかった.本論文の目的はこの比較評価にある.具体的には本論文では,各種類似度計算法に基づくシソーラスの類似性判別能力と概念ベースのそれを,既に提案している機械化が可能な評価法と一般的に用いられている人間の感覚による評価法により比較評価する(以下,前者を機械的評価法,後者を感覚評価法と呼ぶ).比較対象とするシソーラスとしては,日本語単語については最も大規模かつ代表的といえる日本語語彙体系とEDR電子化辞書のシソーラスを選ぶ.さらにシソーラスについては,従来の距離や共通カテゴリ位置をベースとした計算法に対し,新たに単語が属するカテゴリとシソーラスの構造から得られる情報をもとに各単語をベクトル表現し類似度を算出する方法(以下,ベクトル化法と呼ぶ)を提案する.この方法はベクトル表現を用いているため,概念ベースと同様に視点を考慮した類似性判別の可能性を有する.また,感覚評価法による評価結果との相関をとることにより,機械的評価法自体の評価を行う.以下,2章では,比較対象である日本語語彙体系とEDR電子化辞書のシソーラスおよび概念ベースの構成について述べた後,それらにおける一般的な類似度計算法と案するベクトル化法について示す.また,人間の感覚が指数的であることから,類似度を指数関数を用いて算出する方法を示す.3章では,機械的評価法と感覚評価法について述べる.4章では,各種の類似度計算法と前記2種の評価法のあらゆる組み合わせについての評価を行う.また,ベクトル化法についてはベクトル表現する場合の最適条件を示す.5章では,機械的評価法自体の評価を行うとともに,シソーラスと概念ベースの類似性判別能力について,得られた評価結果を総括する.
机译:对这些词库和基于概念的单词的相似性的歧视能力(以下称为相似性歧视能力)已经进行了单一和单独的措施。[客川03,Kasahara 97,Ishikawa 98],同样的比较评估规模没有发生。本文的目的是在这种比较评估中。具体地,在本文中,我们具有确定基于各种相似性计算方法的叙述的相似性和基于概念评价方法的方法,以及通常使用和常用的人类的人类感。评价方法的比较评估(在下文中,前者称为机械评估方法,后者称为感觉评估方法)。作为待比较的词库,选择日语词汇系统和EDR电子词典的同义词,可以说是日语单词的最大且典型的。此外,对于基于常规距离和公共类别位置的计算方法,表达了每个单词,并且基于从该词所属的类别获得的信息来计算相似性,并且获得了词库的结构。我们提出方法(以下称为矢量化方法)。由于该方法使用矢量表示,因此考虑到概念基础的观点,它具有相似性歧视的可能性。另外,通过通过感官评估方法与评估结果的相关性,评估机械评估方法本身。在下文中,在第2章描述了日语词汇系统的概念和基于概念的配置和要比较的EDR电子词典,并且将矢量化方法显示为它们中的一般相似性计算方法。另外,由于人类感觉是指数的,所以它示出了使用指数函数计算相似性的方法。第3章介绍了机械评估方法和感官评估方法。在第4章中,各种相似性计算方法和评估对评估方法的所有组合。另外,示出了矢量化方法的最佳条件。在第5章中,评估机械评估方法本身,并概述了基于词库和基于概念的相似性确定能力的结果的评估结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号