首页> 中文学位 >基于机器学习分类算法的新股开板当日再封板预测及策略应用研究
【6h】

基于机器学习分类算法的新股开板当日再封板预测及策略应用研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 选题背景与研究意义

1.2 量化投资国内外发展现状

1.2.1 国外量化投资发展现状

1.2.2 国内量化投资发展现状

1.2.3 量化投资预测模型的发展现状

1.3 主要研究内容与研究方法

1.4 研究创新点

2 机器学习分类算法在量化投资中的预测应用文献综述

2.1 BP神经网络算法在量化投资中的预测应用研究综述

2.2 随机森林算法在量化投资中的预测应用研究综述

2.3 支持向量机算法在量化投资中的预测应用研究综述

2.4 本章小结

3 三种机器学习分类算法原理概述

3.1 BP神经网络算法原理

3.2 随机森林算法原理

3.3 支持向量机算法原理

3.4 三种算法对比

4 我国沪深A股新股样本变量构建

4.1 封板新股样本界定及收益率统计

4.2 样本变量构建

4.3 各样本变量数据来源及处理

4.3.1 新股IPO及开板前市值与市盈率

4.3.2 新股所属指数板块及开板前板块热度

4.3.3 新股所属行业板块及开板前板块热度

4.3.4 新股所属行业板块及开板前板块热度

4.3.5 输入交量间相关性检验

4.4 本章小结

5 机器学习分类算法预测新股开板当日再封板结果及分析

5.1 随机森林模型训练及参数优化

5.2 支持向量机模型训练及参数优化

5.3 BP神经网络模型训练及参数优化

5.4 三种算法预测结果综合对比分析

5.5 本章小结

6 基于预测模型的新股开板后交易策略研究

6.1 基于新股开板再封板分类预测模型的交易策略构建

6.2 交易策略样本内测试结果及分析

6.3 交易策略样本外测试结果及分析

6.4 本章小结

7 结论与展望

7.1 基本结论与投资建议

7.2 研究不足及展望

参考文献

展开▼

摘要

本研究在系统性地综述了国内外量化投资发展状况与机器学习分类算法在量化投资应用研究成果的基础上,着重阐述了BP神经网络、随机森林、支持向量机三种监督性分类算法的概念与原理,结合2014年年初以来我国A股市场新股上市之后所呈现的连续一字涨停板现象,首创性地将各分类算法应用于预测新股开板后当日能否再次封住涨停板的应用场景中;在界定了具有“IPO后打开一字涨停板当天能够重新封住涨停板”特征的新股样本作为分类预测对象的同时,较为深入地结合了股市基本面分析框架,选择了上市公司的规模、估值、盈利等自身的特质变量以及市场或行业热度及风格转换等不同维度与类型的外部市场变量构建了七个样本输入特征对各分类模型进行了监督性训练及参数优化,筛选出了三种算法在本研究情境下的最优参数模型,构建了一套完整的基于这三个分类预测模型的新股开板后博求再封板的短期交易策略,并对不同参数维度下的新股交易策略进行了样本内回溯测试与样本外模拟交易测试,主要得出了以下几点结论与新股短期交易建议:1.从交易策略的标的选择上看,若不对打开一字涨停板的新股进行一定的过滤而直接对所有新股在打开涨停板后均进行短期追多投机交易,从长期来看是一个大概率会造成净值亏损的交易策略,而若能够有效地筛选出本研究所界定的“在打开涨停板当日能够再次封住涨停板”特征的新股且仅对这部分新股进行短期追多交易,则能够获得较高的收益风险比。2.对于任意新股,买入后不宜持有过长时间,在1-3个交易日内选择股价高点进行择机卖出该新股是较为合理的操作方案。3.三个模型预测表现方面,最优参数下的随机森林对样本内与样本外的预测准确度皆为三者中最高,具有良好的抗过拟合特性。在犯错误预测类型方面,最优参数下的随机森林犯“弃真”错误的概率显著低于支持向量机与BP神经网络,而最优参数下的支持向量机犯“取伪”错误的概率则显著低于随机森林与BP神经网络。4.在本研究构建的7个特征变量中,“开板前所属行业热度”、“开板前所属指数板块热度”以及“招股说明书中的业绩预告”等变量对分类预测的方差贡献度较高,其余变量则相对较低。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号