基于中文维基百科的词语相关度计算

谌志群; 高飞; 曾智军

首页> 中文期刊> 《情报学报》 >基于中文维基百科的词语相关度计算

基于中文维基百科的词语相关度计算

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用.国内现有大部分词语相关度计算方法是基于知网(HowNet)的.本文将中文维基百科作为语义资源,利用其分类层次、概念文档之间的链接来计算汉语词语之间的相关度.在借鉴向量空间模型和谷歌相似度(Google Similarity Distance)计算方法基础上,通过构建分类图和相关语义向量来实现汉语词语相关度的计算.在测试集WordSimilarity-353上进行了实验,实验结果的斯皮尔曼等级相关系数显示,本文的方法是可行和有效的.%Word relatedness measure is one of the key teehnologies in natural language proeessing. It is widely usedrnin the fields of information retrieval, machine translation, word disambiguation and syntax analysis, etc. Most of existing methods of Chinese word relatedness computing is based on HowNet resource. In this paper, based on Chinese Wikipedia, the relatedness among Chinese words is measured by making use of the links of classification hierarchy and the links ofrnvector based on vector space model and Google similarity distance of information retrieval technology. The experiments are performed on the test set WordSimilarity-353 and the Spearman rank correlation coefficient shows that the proposed method of word relatedness measure is feasible and effective.

著录项

来源
《情报学报》 |2012年第12期|1265-1270|共6页
作者
谌志群; 高飞; 曾智军;
展开▼
作者单位

杭州电子科技大学计算机应用技术研究所;

杭州310018;

杭州电子科技大学计算机应用技术研究所;

杭州310018;

杭州电子科技大学计算机应用技术研究所;

杭州310018;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
词语相关度计算; 维基百科; 分类图; 语义向量;

相似文献

中文文献
外文文献
专利

1. 基于中文维基百科的词语语义相关度计算 [J] . 万富强 ,吴云芳 . 中文信息学报 . 2013,第006期
2. 中文维基百科的结构化信息抽取及词语相关度计算方法 [J] . 涂新辉 ,张红春 ,周琨峰 . 中文信息学报 . 2012,第003期
3. 一种基于维基百科的中文词语相关度学习算法 [J] . 黄岚 ,杜友福 . 中文信息学报 . 2016,第003期
4. 维基百科的中文语义相关词获取及相关度分析计算 [J] . 李赟 ,黄开妍 ,任福继 . 北京邮电大学学报 . 2009,第3期
5. 基于维基百科链接特征的词语语义相似度计算 [J] . 张波 . 软件工程师 . 2019,第010期
6. 中文维基百科的结构化信息抽取及词语相关度计算 [C] . Zhang Hong-chun ,张红春 ,He Ting-ting . 第十一届全国计算语言学学术会议 . 2011
7. 中文维基百科的结构化信息抽取及词语相关度计算 [A] . 张红春 . 2011

基于中文维基百科的词语相关度计算

摘要

著录项

相似文献

相关主题

期刊订阅