首页> 中文期刊>中文信息学报 >一种改进的基于《知网》的词语语义相似度计算

一种改进的基于《知网》的词语语义相似度计算

     

摘要

中科院刘群的基于<知网>的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一.在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与"贼眉鼠眼"的相似度为0.814 815,与"优雅"的相似度为0.788 360,"深红"与"粉红"的相似度仅为0.074 074,这将不利于进行词语的极性识别.基于文本情感色彩分析的需要,把词语相似度的取值范围规定为[-1,+1],在刘群论文的基础上,进一步考虑了义原的深度信息,并利用<知网>义原间的反义、对义关系和义原的定义信息来计算词语的相似度.在词语极性识别实验中,得到了较好的实验结果:P值为99.07%,R值为99.11%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号