首页> 中文期刊>计算机应用研究 >一种融合位置信息的字符串相似度度量方法

一种融合位置信息的字符串相似度度量方法

     

摘要

Aimed at the limitation of traditional string similarity complex algorithm,this paper proposed an algorithm based on vector space model to calculate string similarity,which fused both character adjacent position relation and word order informa-tion.This method described adjacent degree through computing Hamming distance of vector in VSM.Then it figured out word order similarity based on vector Manhattan distance.Finally,the algorithm presented quantitative description to string similari-ty fusing the word order and character adjacent degree.Compared with the traditional method,the proposed algorithm decrea-ses the time complexity to O(n log(n)).Experimental results show that the method improves precision rate and gets more rea-sonable data result.%针对传统字符串相似度算法复杂的局限,在向量空间模型(VSM)的基础上,提出一种同时考虑字符相邻位置关系和词序的字符串相似度计算模型。通过计算 VSM中向量的汉明距离来描述字符串相邻程度,并以向量的曼哈顿距离作为衡量字符先后次序的指标。最后对两个指标加权求和得到字符串相似度的定量描述。与传统的算法比较,该算法更简便,时间复杂度为 O(n log(n))。实验结果表明,该方法提高了字符串相似度的准确率,得到的数据结果更合理。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号