声明
摘要
第一章 绪论
1.1 研究背景
1.1.1 证券业的飞速发展及对国民经济和民生的重要作用
1.1.2 证券投资分析的意义
1.1.3 本文问题提出的理论意义和现实意义
1.2 国内外相关研究综述
1.2.1 国外相关研究状况
1.2.2 国内相关研究状况
1.3 本文的研究内容和研究方法
1.3.1 研究内容
1.3.2 研究方法
1.4 本文结构安排
第二章 数据挖掘与机器学习简介
2.1 数据挖掘
2.1.1 数据挖掘概述
2.1.2 数据挖掘的分类
2.1.3 数据挖掘的步骤
2.2 机器学习
2.2.1 机器学习概述
2.2.2 有监督学习
2.2.3 无监督学习
2.2.4 半监督学习
2.3 本章小结
第三章 数据集获取及处理
3.1 数据集获取
3.1.1 数据集介绍
3.1.2 下载工具
3.2 分布式计算
3.2.1 分布式开源平台Hadoop
3.2.2 并行计算框架MapReduce
3.3 数据集预处理
3.3.1 数据集合并
3.3.2 数据集清洗
3.3.3 数据集抽取
3.3.4 数据集标准化
3.4 拟合价格指数
3.4.1 计算价格分钟指数
3.4.2 价格分钟指数与大盘指数对比
3.5 本章小结
第四章 面向大数据模式识别算法
4.1 KNN算法
4.1.1 KNN算法简介
4.1.2 KNN算法步骤
4.1.3 KNN算法优缺点
4.1.4 优化KNN算法
4.2 面向大数据模式识别算法
4.2.1 算法简介
4.2.2 数据标准化
4.2.3 求解拟合函数
4.2.4 算法整体步骤
4.2.5 算法伪代码
4.3 本章小结
第五章 提取特征向量
5.1 分钟价格特征
5.1.1 特征一:上升下降趋势总对比
5.1.2 特征二:上升动能
5.1.3 特征三:动能趋势
5.1.4 特征四:分价动能趋势
5.1.5 特征计算对应表
5.2 K线特征
5.2.1 特征一:最小成交量比
5.2.2 特征二:平均成交量比
5.2.3 特征三:价格量比
5.2.4 特征计算对应表
5.3 股本特征
5.3.1 特征一:真实换手率
5.3.2 特征二:线内涨跌幅
5.3.3 特征三:成交量比
5.3.4 特征四:价格位置
5.3.5 特征计算对应表
5.4 定义标签
5.4.1 分钟价格特征标签
5.4.2 K线特征标签
5.4.3 股本特征标签
5.5 本章小结
第六章 实验设计与结果分析
6.1 实验环境
6.2 实验设计步骤
6.3 实验结果与分析
6.3.1 特征值有效性验证
6.3.2 算法对比
第七章 总结与展望
7.1 总结
7.2 下一步的工作
参考文献
发表论文和参加科研情况
致谢