首页> 外文期刊>電子情報通信学会技術研究報告 >多義性を考慮した同時共起クラスタリングによる動詞の類語抽出
【24h】

多義性を考慮した同時共起クラスタリングによる動詞の類語抽出

机译:考虑多义性的同时共现聚类提取动词同义词

获取原文
获取原文并翻译 | 示例
       

摘要

動詞間で共通する概念を有する動詞の類語をテキストデータから注することを目的としている.動詞の語義は係り関係にある名詞との組み合わせにより決まるが,問題は動詞だけでなく名詞も多義性を有することである.これに対して本研究では動詞と名詞を同時にクラスタリングする手法を提案してきたが,各初期クラスタから有益なクラスタを十分獲得できなかった.本発表では初期クラスタから抽出された動詞の語義を消去し繰り返しクラスタリングを行うことで格のバリエーションや動詞の複数の語義を積極的に取り出す方法を提案する.毎日新聞ならびに均衡コーパスに対して動詞クラスタ抽出実験を行いその結果について報告する.%In the previous work we show that a co-clustering approach is suitable for verb synonym extraction because of polysemy of both noun and verb. The proposed approach is promising, however, it has not succeeded in initial graphs of verb-noun pairs. Thus in this paper we present a modified co-clustering approach with recursively extracting other possible verb gourps from the same verb-noun pairs; this enables us to actively obtain other meanings of each verb. The experimental results of verb synonym extraction from Japanese news paper corpus and balanced corpus show that the modified approach outperformed the previous one in precision and recall rates.
机译:目的是注入来自文本数据的动词之间具有相同概念的动词同义词。动词的含义由与具有关联关系的名词的组合决定,但问题是不仅动词而且名词都具有多义性。另一方面,在这项研究中,我们提出了一种同时对动词和名词进行聚类的方法,但是我们无法从每个初始聚类中获得足够的有用聚类。在本演示中,我们提出了一种方法,该方法通过消除从初始聚类中提取的动词含义并执行重复聚类来主动提取大小写变化和多个动词含义。对《每日新闻》和平衡语料库进行了动词类群抽取实验,并报道了结果。 %在先前的工作中,我们表明由于名词和动词的多义性,共聚方法适用于动词同义词提取,尽管该方法很有希望,但在动词-名词对的初始图上没有成功。在本文中,我们提出了一种改进的共聚方法,该方法从相同的动词-名词对中递归地提取其他可能的动词词组,这使我们能够积极地获得每个动词的其他含义。平衡语料库表明,改进后的方法在准确性和召回率方面优于以前的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号