首页> 中文学位 >基于集成学习的社交媒体信息对股票预测作用研究
【6h】

基于集成学习的社交媒体信息对股票预测作用研究

代理获取

目录

第 1 章 绪 论

1.1研究背景与意义

1.1.1研究背景

1.1.2研究意义

1.2文献综述

1.2.1股票市场预测研究

1.2.2社交媒体数据对股市的影响研究

1.3相关概念界定

1.4研究内容与方法

1.4.1论文研究内容

1.4.2研究方法

第 2 章 理论基础

2.1股票投资理论

2.2数据挖掘技术

2.2.1分类和回归树

2.2.2随机森林

2.2.3梯度提升树

2.2.4极端梯度提升

2.2.5支持向量机

2.2.6 Stacking 集成学习

第 3 章 数据收集与预处理

3.1数据来源

3.1.1新浪微博

3.1.2深交所互动易

3.1.3雪球网、股吧数据

3.1.4股票市场数据

3.2数据获取

3.2.1数据获取方法

3.2.2股票市场数据

3.2.3企业生成信息数据获取

3.2.4用户生成信息数据获取

3.2.5企业-用户交互生成信息数据获取

第 4 章 社交数据与股票市场预测实验对比与结果分析

4.1特征工程

4.1.1企业生成信息数据量化

4.1.2用户生成信息数据量化

4.1.3企业-用户交互生成信息数据量化

4.2影响股票价格和换手率的特征选择

4.2.1特征变量的相关性检验

4.2.2特征变量的重要性程度分析

4.3股票价格和换手率预测模型构建

4.3.1建立概念模型

4.3.2模型参数优化

4.3.3模型评价与效果评估

4.4研究启示与政策建议

4.4.1研究启示

4.4.2政策建议

结 论

参考文献

附录 A 攻读学位期间发表学术论文目录

附录 B 攻读学位期间参与的科研项目

附录 C 本文主要实验代码

致 谢

展开▼

摘要

随着网络社交媒体的快速发展以及我国网络普及率的不断提升,网络社交媒体平台已成为投资者之间,以及投资者和企业沟通交流的重要渠道。一方面,投资者可以在网络社交媒体平台上获取企业发布的信息,与其他投资者交流、分享投资经验。另一方面,企业也可以通过网络社交媒体平台了解投资者情绪,进行客户关系管理。在企业和投资者使用社交媒体平台的过程中,产生了大量有价值的数据,这些数据通常与股票市场具有一定程度的相关性,如何利用这些数据对股票市场进行预测,为投资者提供投资建议;哪些数据在预测模型中的重要性程度更高。这些问题是当前学术界和企业界研究的热点,也是本文研究的重点。  本文以深交所上市企业中数据较完整的234家企业作为样本公司,从企业生成信息、用户生成信息以及企业-用户交互生成信息三个维度出发,通过网络爬虫代码抓取了新浪微博42万条企业生成数据、深交所互动易平台中23万条企业与用户交互产生的问答数据,以及将近300万条雪球网、股吧平台中的用户发帖数据。基于这部分社交媒体数据,本文抽取了10个特征变量,构建Stacking集成学习框架,预测股票价格涨跌以及换手率。  本文的研究结果表明,在股票市场预测模型中,用户生成信息的重要性程度,大于企业生成信息,大于企业-用户交互生成信息。其次,本文构建的Stacking集成学习框架在回归和分类两类方法中,预测准确率均有提升。最后,本文构建的特征变量和模型对样本公司股票价格涨跌预测的平均准确率为76.4%,并且所有样本公司的股票价格涨跌预测准确率均在70%以上,同时有18.38%的公司准确率达到了80%以上。本文丰富了社交媒体数据对股票市场预测的相关研究,同时能够为广大投资者的投资行为提供参考。

著录项

  • 作者

    刘亮;

  • 作者单位

    湖南大学;

  • 授予单位 湖南大学;
  • 学科 管理科学与工程
  • 授予学位 硕士
  • 导师姓名 马超群;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    股票市场,社交媒体数据,Stacking集成学习;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号