首页> 中文学位 >开源情报中的多目标关联分析及行为预测
【6h】

开源情报中的多目标关联分析及行为预测

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

§1.1课题的背景及意义

§1.2国内外研究现状

§1.3主要研究内容

§1.4论文组织结构

第二章 相关工作

§2.1 文本挖掘的理论基础

§2.2 多目标行为预测的理论基础

第三章 基于fp-growth 和k均值的文本聚类研究

§3.1 频繁项集挖掘fp-growth算法

§3.2基于fp-growth 和k 均值的文本聚类算法

§3.3 实验分析

§3.4本章小结

第四章 基于多目标行为预测的研究

§4.1情感分析模型

§4.2 融合情感的多目标行为预测模型

§4.3实验分析

§4.4 本章小结

第五章 总结与展望

§5.1 研究总结

§5.2 研究展望

参考文献

致谢

作者在攻读硕士期间的主要研究成果

展开▼

摘要

随着互联网的快速发展,人们对预测事物未来的发展趋势越来越感兴趣。然而,网络数据的多样化、复杂化使预测的难度大大增加,如何从海量的信息中获取有价值的信息并用于预测是一项十分艰巨的任务。其实在生活中人们经常不自觉的进行预测,如今天是否下雨、股票是否会涨,只不过预测结果来源于生活经验的总结,缺乏科学的理论支持。而现有的预测模型经过数学定理的证明,预测结果具有很强说服力。预测模型需要格式化的文本,文本聚类无监督的对文本分类很好的支持了预测模型对数据的需要。但是只有不断的对模型进行改进,才能将预测结果的准确率提高并应用于生活中。所以对预测模型的研究具有重要的现实意义。 首先,本文提出了一种基于fp-growth和k均值的文本聚类算法。针对k均值算法由于初始聚类质心的随机选择,导致聚类结果的局部最优,采取fp-growth算法挖掘文本的频繁项集,通过频繁项集的过滤选出初始聚类质心。频繁项集代表了每一个簇的主题,所选的初始聚类质心则分属于每一个簇。与随机初始质心相比,避免了结果的局部最优,而且解决了孤立点作为初始质心带来的问题。另外,k均值算法需要指定簇的个数,在数据量较大的情况下是很难合理估计簇的个数。本文算法通过挖掘的频繁项集的个数来估计簇的个数,并可以通过对聚类结果的粒度来调节结果中簇的个数。 其次,在文本聚类的数据基础上,提出了一种基于情感的多元线性回归预测模型。针对传统的单一因素预测模型对影响因素分析不够全面,该模型考虑多因素对预测结果的影响。网络的快速发展,方便了人们发表对事物的看法,而事物的发展趋势往往受到人们观点的影响。如商品的销量、股票的增长情况等。算法考虑了情感的因素对事物的影响并且将其数值化进行模型训练,找到情感因素对预测结果最佳的影响程度。最后,将本文算法应用于对某公司手机销量预测的实验中,实验证明了本文算法具有较好的可行性、准确性。

著录项

  • 作者

    张银明;

  • 作者单位

    桂林电子科技大学;

  • 授予单位 桂林电子科技大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 黄廷磊;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    开源; 情报; 多目标; 关联分析;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号