基于加权语义网的改进文本相似度计算方法

张弛; 张贯虹; 周艳玲

首页> 中文期刊> 《邵阳学院学报（自然科学版）》 >基于加权语义网的改进文本相似度计算方法

基于加权语义网的改进文本相似度计算方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络.然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover's distance,EMD)衡量两个文本间的语义相似度.最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法.

著录项

来源
《邵阳学院学报（自然科学版）》 |2019年第3期|18-26|共9页
作者
张弛; 张贯虹; 周艳玲;
展开▼
作者单位

合肥学院计算机科学与技术系;

安徽合肥;

230601;

合肥学院计算机科学与技术系;

安徽合肥;

230601;

合肥学院计算机科学与技术系;

安徽合肥;

230601;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
复杂网络; 特征词; EMD距离; 文本相似度; HowNet;

相似文献

中文文献
外文文献
专利

1. 基于加权语义网的文本相似度计算方法研究 [J] . 张弛 ,周艳玲 ,张贯虹 . 赤峰学院学报（自然科学版） . 2019,第005期
2. 基于加权语义网的文本相似度计算的研究 [J] . 廖开际 ,杨彬彬 . 情报杂志 . 2012,第007期
3. 多重检验加权融合的短文本相似度计算方法 [J] . 石彩霞 ,李书琴 ,刘斌 . 计算机工程 . 2021,第002期
4. 一种改进的基于加权模型的概念相似度计算方法 [J] . 刘欣荣 ,阳光 . 微电子学与计算机 . 2012,第2期
5. 基于文本加权词共现的跨语言文本相似度分析 [J] . 张晓宇 ,王永滨 ,吴林 . 软件导刊 . 2020,第002期
6. 基于语义网的二层单准专家系统及其改进型 [C] . 周训伟 ,梁晔 . 中国计算机用户协会网络应用分会2009年网络新技术与应用年会 . 2009
7. 一种基于语义网络的中文文本相似度计算方法 [A] . 邹能清 . 2015

基于加权语义网的改进文本相似度计算方法

摘要

著录项

相似文献

相关主题

期刊订阅