首页> 中文学位 >组合聚类方法在文本聚类中的应用研究
【6h】

组合聚类方法在文本聚类中的应用研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1课题背景

1.2研究意义

1.3国内外研究现状

1.4本文研究内容

1.5论文组织结构

第二章文本聚类的相关技术

2.1聚类分析介绍

2.1.1文本挖掘

2.1.2文本聚类与文本分类

2.1.3聚类方法的分类

2.2中文文本聚类过程

2.3文本的表示--向量空间模型

2.4维数消减

2.4.1有监督特征选择

2 4.2无监督特征选择

2.5特征项权值和相似度计算

2.5.1特征项权值计算

2.5.2相似性度量

2.6本章小结

第三章组合聚类算法的分析与改进

3.1 SOM聚类算法

3.1.1 DSOM神经网络介绍

3.1.2 DSOM神经网络算法思想

3.1.3算法优缺点

3.2 K-均值聚类算法分析

3.2.1 K-均值聚类介绍

3.2.2 K-均值聚类算法思想

3.2.3算法优缺点

3.3模糊聚类算法分析

3.3.1模糊聚类算法的简介

3.3.2 FCM聚类算法思想

3.3.3 FCM算法的优缺点

3.4聚类方法的改进之一:DSOM-FS-K-means组合聚类方法

3.4.1新的文本聚类流程模型之一--DSOM-FS-K-means

3.4.2算法思想

3.5聚类方法的改进之二:DSOM-FS-FCM组合聚类方法

3.5.1新的文本聚类流程模型之二--DSOM-FS-FCM

3.5.2算法思想

3.6本章小结

第四章实验证明

4.1实验环境

4.2评价指标

4.3实验结果分析

4.3.1实验一DSOM-FS-K-means组合聚类方法有效性分析

4.3.2实验二DSOM-FS-FCM组合聚类方法有效性分析

4.4本章小结

第五章总结与展望

5.1工作总结

5.2展望

参考文献

附录 系统实现部分程序

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

互联网时代,web中的文本数量和访问这些文档的人数一直在海量增加,对这些数量巨大的文本信息,人们要想找出一些相关主题的内容,仅靠人工的分类方法已经不能符合实际需要了。借助计算机来帮助我们进行WEB内容的整理再进行后继的处理是目前一种常见的手段。文本聚类研究是数据挖掘非常热门的研究课题之一。 目前研究文本聚类的算法有很多,主要集中在单次聚类及其相关参数的改进上,本文研究的重点是组合聚类方法。 首先分析了文本聚类中比较流行的3种聚类算法(SOM聚类算法、K-means聚类算法、FCM聚类算法),对这3种算法进行了详细的介绍并分析了各自的优缺点。 然后,结合文本特征选择方法的特点分析,提出了两种组合聚类流程模型,从理论上说明其有效性及特点,并详细介绍了与其对应的聚类算法:DSOM-FS-K-means算法和DSOM-FS-FCM算法,其中,在DSOM-FS-FCM算法中,还使用了优化函数对FCM算法中的隶属度函数进行调整,降低了孤立点数据对聚类效果的影响。 最后,为了验证组合聚类算法的有效性,我们把这两种组合算法与各自相对应的单次聚类算法和没有结合特征选择的组合聚类算法进行对比,对实验结果进行分析,证明了组合聚类算法的优越性。

著录项

  • 作者

    方春;

  • 作者单位

    华中师范大学;

  • 授予单位 华中师范大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 胡金柱;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.135.4;
  • 关键词

    数据挖掘; 组合聚类; 特征选择; 文本聚类;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号