一种基于语义相似度的文本聚类算法

孙爽; 章勇

首页> 中文期刊>南京航空航天大学学报 >一种基于语义相似度的文本聚类算法

一种基于语义相似度的文本聚类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用.现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项.这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系.本文提出了一种基于语义相似度的文本聚类算法--TCUSS(Text clustering using semantic similarity)算法.TCUSS算法将文档表示成概念列表,有效地解决了数据维数高和聚簇描述难的问题,并给出如何利用概念列表进行聚簇描述的方法.TCUSS算法利用两个概念列表中单词间的语义相似度作为文档间相近程度的度量,并以图为基础进行聚类分析,避免有些聚类算法对聚簇形状的限制.实验证明,TCUSS算法提高了聚类质量.

著录项

来源
《南京航空航天大学学报》|2006年第6期|712-716|共5页
作者
孙爽; 章勇;
展开▼
作者单位

南京航空航天大学信息科学与技术学院,南京,210016;

南京航空航天大学信息科学与技术学院,南京,210016;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
文本聚类; 语义相似度; 文本表示; 语义相似度的文本聚类算法;
入库时间 2022-08-17 16:00:28

相似文献

中文文献
外文文献
专利

1. 一种基于语义相似度的信息资源语义聚类算法 [J] . 熊芳 ,黄宏斌 ,黄玉成 . 计算机工程与科学 . 2012,第011期
2. 基于概念和语义相似度的文本聚类算法 [J] . 焦芬芬 . 计算机工程与应用 . 2012,第018期
3. 一种基于本体相似度计算的文本聚类算法研究 [J] . 王刚 ,钟国祥 . 计算机科学 . 2010,第009期
4. 一种基于Small-World和相似度的文本聚类算法 [J] . 董洛兵 ,马力 ,焦李成 . 情报杂志 . 2006,第002期
5. 一种基于语义与句法结构的短文本相似度计算方法 [J] . 赵谦 ,荆琪 ,李爱萍 . 计算机工程与科学 . 2018,第007期
6. 基于文本语义相似度的文本语义关系标注 [C] . 秦春秀 ,赵捧未 . 第二十届全国计算机信息管理学术研讨会 . 2006
7. 基于语义相似度的中文文本聚类算法研究 [A] . 杨开平 . 2018

一种基于语义相似度的文本聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅