模糊聚类算法及其在中文文本聚类中的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，伴随着互联网络的快速发展与壮大，各种各样形式的信息也随之而来，在为用户提供大量信息的同时，也给用户从中获取有价值的信息增加了更多的困难。因此如何能够从如此众多的信息中获取到对用户有价值的信息已经成为了当今重要的研究课题。在众多信息中，信息量以文本形式存在的方式最为常见，因此，文本处理已经成为用户获取有价值信息的重要手段。其中，模糊聚类算法也已成为文本处理研究的热点问题之一。目前，经典的FCM算法是比较常用的模糊聚类算法之一，此算法具有较好的理论基础支持，在文本处理和模糊识别等方面都得到了广泛的应用。但是，经典的FCM算法也存在三方面缺点：(1)该算法对孤立点数据比较敏感。(2)算法的效果的好坏很大程度上取决于参数初值选取。(3)FCM算法容易陷入局部极值点，而得不到最优解。
　　本文针对第一个缺点通过对数据的隶属度进行加权修改进行改进。本文通过构造模糊相似矩阵并结合统计学知识来解决第二个缺点，以达到良好的初始值选取的效果。对于第三个缺点，引入进化策略优化算法并结合了FCM构成混合型聚类算法使此类问题得以解决。通过以上的研究和改进的基础上，本文提出了新的模糊聚类算法NFCM和NES-FCM，并与经典的FCM算法进行了测试比较。通过实验结果表明新的模糊聚类算法NFCM和NES-FCM提高了聚类的精确性和有效性，并且充分发挥了FCM算法的局部搜索和全局搜索能力。最后，本文设计并实现了基于模糊聚类的中文文本聚类模型，并在该模型中对改进的模糊聚类算法进行了研究和应用，实验结果表明改进后的模糊聚类算法在中文文本聚类处理上具有良好的表现，同时表明了该中文文本模型是有效的。

著录项

作者
姜伦;
展开▼
作者单位

哈尔滨理工大学;

展开▼
授予单位哈尔滨理工大学;
学科计算机应用技术
授予学位硕士
导师姓名丁华福;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字处理软件;
关键词
信息处理; 文本聚类; 聚类分析; 模糊算法;

相似文献

中文文献
外文文献
专利

1. 自适应的模糊谱聚类算法在文本聚类中的应用 [J] . 牛海燕 ,陈笑蓉 . 贵州大学学报（自然科学版） . 2015,第006期
2. 模糊聚类算法在汉语文本聚类中的应用 [J] . 李家福 ,张亚非 ,陆建江 . 计算机工程 . 2002,第004期
3. Web文本聚类算法WTCA的研究与实现 [J] . 郑煜 ,钱榕 . 计算机工程与应用 . 2007,第004期
4. 基于语义簇的中文文本聚类算法 [J] . 齐向明 ,孙煦骄 . 吉林大学学报（理学版） . 2019,第005期
5. 基于Canopy+K-means的中文文本聚类算法 [J] . 张琳 ,牟向伟 . 图书馆论坛 . 2018,第006期
6. 基于模糊核的自适应半监督文本聚类算法 [C] . 赵培坤 ,周新建 . 2008中国计算机大会 . 2008
7. 中文文本聚类算法的研究与实现 [A] . 吴启纲 . 2010

模糊聚类算法及其在中文文本聚类中的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅