首页> 外文期刊>電子情報通信学会技術研究報告 >グラフに基づくクラスタリングによる動詞類義語の獲得
【24h】

グラフに基づくクラスタリングによる動詞類義語の獲得

机译:通过基于图的聚类获取动词同义词

获取原文
获取原文并翻译 | 示例
       

摘要

本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ペケトルベースのクラスタリングより精度が高いことを示した.しかし.近年ベクトルベースのクラスタリングでKernel K-means という非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-means でのグラフパクトルの等価性には限界があり.本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.%This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. Prom this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction.
机译:在这项研究中,我们正在研究一种使用聚类获取动词同义词的方法。在先前的研究中,我们应用了同时共现聚类,该聚类同时考虑了两个元素聚类,并表明其准确性高于基于汽油的聚类。然而。近年来,针对基于矢量的聚类提出了一种更高级的在非线性边界上聚类的方法,称为Kernel K-means。因此,在本报告中,我们将Kernel K-means方法应用于动词同义词获取,并将其与在先研究中具有相同数据的共现聚类进行比较。根据该结果,内核K均值中的图矢量的等效性受到限制。我们报告说,本研究中使用的二部图的结构不能直接反映出来,并且先前研究中的同义词聚类可以更高精度地获取同义词。本文描述了Kernel K-means聚类方法与改进的Aizawa的共聚方法进行动词同义词提取任务的评估结果.Kernel K-means方法是基于向量的最新聚类方法之一,可以但是,在手稿中,我们揭示了相泽的共同聚类方法克服了动词上的核K-均值。日语中的句法提取任务(双向图聚类)。为此,我们讨论了可以限制内核K均值方法中图矢量空间之间的等价关系,然后内核K均值在我们的动词同义词提取中会降低其准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号