首页> 中文期刊>重庆理工大学学报(自然科学版) >基于群体智能的跨语言网络舆情文本聚类模型

基于群体智能的跨语言网络舆情文本聚类模型

     

摘要

跨语言的互联网文本信息在中国多个民族构成中非常普遍,但当前文本聚类模型主要针对单一语言,跨语言文本挖掘的研究较少。群体智能算法具有自组织、启发式、自适应和鲁棒性的特点,提出一种基于群体智能的跨语言网络舆情文本聚类模型SI-Cluster(swarm-intelligence-based text clustering model),应用3种优化策略。梯度下降法弱化智能体拾取文本的能力,避免陷入局部最优解,添加信息素引导智能体移动并有效避免信息素挥发过快的问题,智能体从当前位置选择下一位置考虑信息素感应浓度和方向权重因子。在中文、英文和藏文文本数据集上进行实验,从聚类准确性上看应用优化策略的SI*-Cluster算法的F-measure值达到0. 862,相比于k-means算法提高44. 1%;从收敛性上看SI*-Cluster算法在聚类效果明显的前提下迭代500次收敛,相比SI-Cluster算法900次收敛,具有更快的收敛速度。模拟展示了SICluster和SI*-Cluster算法进行文本聚类的迭代过程,证明所提优化策略的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号