首页> 中文学位 >网络信息对于股票市场的影响——基于文本挖掘技术对股票论坛的分析
【6h】

网络信息对于股票市场的影响——基于文本挖掘技术对股票论坛的分析

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 问题的提出

1.2 研究背景与意义

1.2.1 研究背景

1.2.2 理论意义

1.2.3 现实意义

1.3 论文结构

1.4 本文的创新与不足

1.4.1 创新点

1.4.2 不足之处

2 文献综述

2.1 量化网络信患的方法

2.1.1 以发帖量或搜索强度等数字指标量化网络信息

2.1.2 用文本挖掘工具直接量化网络文本信息

2.2 检验网络信息影响的方法

3 朴素贝叶斯文本分类

3.1 选用贝叶斯分类方法的原因

3.2 朴素贝叶斯算法的原理

3.2.1 数据(文本)挖掘技术简介

3.2.2 将文本量化为数字

3.2.3 朴素贝叶斯算法

3.3 数据来源及贝叶斯分类结果

3.3.1 数据来源

3.3.2 数据呈现

3.3.3 训练数据集的准备

3.3.4 贝叶斯分类结果及解读

3.4 指标构建

3.4.1 情绪指数的构建

3.4.2 意见分散度指数的构建

4 网络信息对于股票市场的影响

4.1 网络信息变量的特征

4.1.1 情绪指数、意见分散指数与市场波动

4.1.2 发帖的时间分布

4.2 定量分析

4.2.1 相关关系

4.2.2 无滞后回归

4.2.3 带滞后期的回归

5 结论与建议

5.1 主要结论

5.2 政策建议

5.3 未来研究展望

参考文献

附录

展开▼

摘要

信息对股票市场的影响是金融学研究的核心问题。近年来随着经济发展和信息技术水平的提升,我国的网民数量持续上升,互联网已经成为中国社会各阶层利益表达、情感宣泄、思想碰撞的重要信息渠道。在这一背景下,利用文本挖掘技术提取网络信息中体现的投资者情绪特征,研究网络信息与股票市场的关联机制具有重要的理论意义与现实意义。
   具体而言,有报道称股票论坛的发帖会对股票走势产生影响。为了验证这一假说,我们选取了中国最大的股票论坛,抓取了200只创业股近两年的历史发帖数据。然后,我们采用朴素贝叶斯分类算法将抓取到的近600万条发帖分成了“积极”“中立/噪音”“消极”三类,并以此为基础构建了情绪指数与意见分散度指数。
   我们考察了网络与证券市场的双向影响,主要结论如下:(1)网络信息具有独特的行为特征。我们观察到,发帖量具有明显的时间分布,在上下午两个交易时间段中,发帖量出现了明显的两个高峰,而且上午盘的峰值略高于下午盘。在晚间9:00左右,发帖量又出现了一个小高峰。(2)网络信息变量充分反映了来自证券市场的信息。我们主要考察波动率、成交量、收益率对于网络发帖行为的影响,发现发帖量、意见分散指数充分反映了来自波动率与成交量的信息。如果一个股票的价格波动越大或成交量越大,那么相关的发帖数就越多,意见分散程度也越高;意见分散指数也反映了来自收益率的影响,高的收益率往往伴随比较严重的意见分散;此外,网络与实体市场的相关性要超出一般的预期。(3)网络信息变量在某种程度上对证券市场具有预测作用。我们发现更大的发帖量与发帖字数往往带来更高的波动率与成交量,且这种预测作用在短时间内并不会很快降低;情绪指数对收益率也有预测作用,但只限于短期内有效;最后,更高涨的情绪带来更大的股价波动。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号