组合聚类方法在文本聚类中的应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网时代，web中的文本数量和访问这些文档的人数一直在海量增加，对这些数量巨大的文本信息，人们要想找出一些相关主题的内容，仅靠人工的分类方法已经不能符合实际需要了。借助计算机来帮助我们进行WEB内容的整理再进行后继的处理是目前一种常见的手段。文本聚类研究是数据挖掘非常热门的研究课题之一。目前研究文本聚类的算法有很多，主要集中在单次聚类及其相关参数的改进上，本文研究的重点是组合聚类方法。首先分析了文本聚类中比较流行的3种聚类算法（SOM聚类算法、K-means聚类算法、FCM聚类算法），对这3种算法进行了详细的介绍并分析了各自的优缺点。然后，结合文本特征选择方法的特点分析，提出了两种组合聚类流程模型，从理论上说明其有效性及特点，并详细介绍了与其对应的聚类算法：DSOM-FS-K-means算法和DSOM-FS-FCM算法，其中，在DSOM-FS-FCM算法中，还使用了优化函数对FCM算法中的隶属度函数进行调整，降低了孤立点数据对聚类效果的影响。最后，为了验证组合聚类算法的有效性，我们把这两种组合算法与各自相对应的单次聚类算法和没有结合特征选择的组合聚类算法进行对比，对实验结果进行分析，证明了组合聚类算法的优越性。

著录项

作者
方春;
展开▼
作者单位

华中师范大学;

展开▼
授予单位华中师范大学;
学科计算机应用技术
授予学位硕士
导师姓名胡金柱;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.135.4;
关键词
数据挖掘; 组合聚类; 特征选择; 文本聚类;

相似文献

中文文献
外文文献
专利

1. 动态索引树文本聚类方法中节点阀值的优化 [J] . 王利峰 . 电脑开发与应用 . 2010,第009期
2. 一种改进型TF-IDF文本聚类方法 [J] . 张蕾 ,姜宇 ,孙莉 . 吉林大学学报（理学版） . 2021,第005期
3. 改进LDA模型的短文本聚类方法 [J] . 孙红 ,俞卫国 . 软件导刊 . 2021,第009期
4. 改进LDA模型的短文本聚类方法 [J] . 孙红 ,俞卫国 . 软件导刊 . 2021,第009期
5. 短文本聚类方法研究综述 [J] . 和志强 ,王梦雪 ,马宁 . 河北省科学院学报 . 2021,第005期
6. 文本聚类方法在网络入侵检测系统中的应用 [C] . 赵俊忠 ,黄厚宽 ,田盛丰 . 第三届全国CSCW暨第一届全国AIN学术会议 . 2002
7. 基于多视图的文本聚类方法的研究与实现 [A] . 李樊 . 2020

组合聚类方法在文本聚类中的应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅