首页> 外文OA文献 >Words Stemming Based on Structural and Semantic Similarity
【2h】

Words Stemming Based on Structural and Semantic Similarity

机译:基于结构和语义相似性的词干

摘要

Words  stemming  is  one  of  the  important  issues  in  the field  of  natural  language processing  and  information retrieval.  There  are  different  methods  for stemming which are mostly language-dependent. Therefore, these  stemmers are only applicable  to  particular  languages.  Because  of the importance  of  this issue,  in  this paper, the proposed method for stemming is aimed to be language-independent. In the  proposed  stemmer,  a  bilingual  dictionary  is  used and  all  of  the  words  in  the dictionary are firstly clustered. The words’ clustering is based on their structural and semantic similarity. Finally, finding the stem of new coming words is performed by making use of the previously formatted clusters. To evaluate the proposed scheme, words  stemming is  done on both  Persian  and  English  languages.  The encouraging results  indicate  the  good  performance  of  the proposed  method  compared  with  its counterparts.
机译:词干是自然语言处理和信息检索领域中重要的问题之一。有许多不同的词干方法,这些方法主要取决于语言。因此,这些词干仅适用于特定语言。由于此问题的重要性,在本文中,提出的词干提取方法旨在独立于语言。在建议的词干中,使用了双语词典,并且首先将词典中的所有单词聚类。单词的聚类基于其结构和语义相似性。最后,通过使用先前格式化的聚类来查找新来词的词干。为了评估提议的方案,在波斯语和英语语言上都加上了词干。令人鼓舞的结果表明,与同行相比,拟议方法的良好表现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号