基于《现代汉语词典》语义空间的中文文本语义相似度研究

高俊芳; 夏劲伟

首页> 中文期刊>情报探索 >基于《现代汉语词典》语义空间的中文文本语义相似度研究

基于《现代汉语词典》语义空间的中文文本语义相似度研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的/意义]针对现有基于向量空间模型(VSM)的中文文本语义相似度计算方法存在空间维度高、数据表示高稀疏性等问题,提出基于《现代汉语词典》汉语语义向量空间构建以及中文文本语义相似度计算方法.[方法/过程]利用分词系统ICTCLAS对《现代汉语词典》中词汇解释条目的文本进行分词、词性标注,依据基底词汇选取原则,经过过滤、解释、替换等操作后,选择出能解释所有中文词汇意义的基底词汇集合,并以此建立汉语语义空间.词汇间的相似度可通过计算词汇向量间的夹角余弦值来获得;中文文本的相似度则可以通过计算中文文本特征语义向量之间的夹角余弦值来得到.[结果/结论]与传统VSM方法和TF-IDF方法相比,实验结果表明本方法获得了较好的准确率和召回率.

著录项

来源
《情报探索》|2018年第11期|10-15|共6页
作者
高俊芳; 夏劲伟;
展开▼
作者单位

江苏师范大学图书馆江苏徐州 221116;

江苏师范大学智慧教育学院江苏徐州 221116;

展开▼
原文格式 PDF
正文语种 chi
中图分类情报学;
关键词
语义相似度; 中文文本; 现代汉语词典; VSM;
入库时间 2023-07-25 11:51:40

相似文献

中文文献
外文文献
专利

1. 基于WV-CNN的中文文本语义相似度计算方法 [J] . 张春英1 ,李春虎1 ,付其峰2 . 华北理工大学学报：自然科学版 . 2019,第001期
2. 基于WV-CNN的中文文本语义相似度计算方法 [J] . . 河北联合大学学报（自然科学版） . 2019,第001期
3. 一种基于语义的中文文本相似度算法 [J] . 夏志明 ,刘新 . 计算机与现代化 . 2015,第004期
4. 语义物联网中基于语义空间的语义协同方法研究 [J] . 丁亚飞 ,李冠宇 ,张慧 . 计算机应用与软件 . 2016,第002期
5. 语义分析与词频统计相结合的中文文本相似度量方法研究 [J] . 华秀丽 ,朱巧明 ,李培峰 . 计算机应用研究 . 2012,第003期
6. 基于层次结构知识元的文本资源语义空间 [C] . QIN Chunxiu ,秦春秀 ,LI Zhenjing . 信息系统协会中国分会第七届学术年会 . 2017
7. 基于语义相似度的中文文本相似度算法研究 [A] . 金希茜 . 2009

基于《现代汉语词典》语义空间的中文文本语义相似度研究

摘要

著录项

相似文献

相关主题

期刊订阅