文摘
英文文摘
第1章 绪论
1.1 选题的研究背景和意义
1.2 文本聚类和文本分类
1.2.1 文本分类和文本聚类的差异
1.2.2 文本分类与文本聚类的共同点
1.3 文本聚类和分类的研究及进展
1.4 文本分类和聚类存在的难点及特点
1.5 本文的主要内容
第2章 聚类算法综述
2.1 聚类分析简介
2.2 主要聚类算法分类
2.2.1 基于划分的聚类方法
2.2.2 基于层次的聚类算法
2.2.3 基于密度的聚类算法
2.2.4 基于模型的聚类算法
2.2.5 基于网格的聚类算法
2.3 如何选择具体的聚类算法
2.3.1 聚类的类型
2.3.2 簇的类型及特征
2.3.3 噪声和离群点的考虑
2.3.4 数据对象的个数
2.4 本章小结
第3章 模糊理论与模糊聚类
3.1 模糊数学理论
3.2 模糊聚类分析
3.3 FCM算法及研究状况
3.4 本章小结
第4章 模糊C均值算法的改进研究
4.1 FCM主要的改进方向
4.2 对于FCM前2个缺点的改进
4.2.1 通过加权后降低孤立点的影响
4.2.2 新的初始值优选方式
4.2.3 NFCM算法的具体步骤
4.2.4 NFCM与FCM算法的实验结果比较
4.3 改变初始聚类原型的选取方式
4.4 基于进化策略优化算法的FCM算法NES-FCM
4.4.1 进化策略算法的基本原理
4.4.2 进化策略算法的设计
4.4.3 用进化策略算法求解聚类问题
4.4.4 NES-FCM算法
4.4.5 适应度函数
4.5 本章小结
第5章 基于模糊聚类的中文文本聚类的模型与实验结果分析
5.1 系统模型
5.2 系统实现及功能模块
5.3 实验设计方案
5.3.1 语料库
5.3.2 评价指标
5.3.3 性能分析
5.4 实验环境说明
5.5 实验过程及结论
5.6 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢