首页> 中文学位 >基于随机森林回归的国债期货价格预测
【6h】

基于随机森林回归的国债期货价格预测

代理获取

目录

第一个书签之前

展开▼

摘要

随着人工智能进入人们的视野,越来越多的投资者将机器学习和证券市场投资结合在一起,以期获得良好的收益。随机森林是机器学习中用于分类和回归的重要工具。本文将5年期国债期货指数(代码TF0000,以下简称TF指数)投资分析转化成一个学习问题,运用2013年9月6日(5年期国债期货上市日)到2015年12月31日的TF指数日收盘价共564个数据对技术指标和宏观经济指标进行筛选,然后再利用筛选后的指标运用随机森林回归模型对2016年1月1日至2017年10月31日的TF指数日收盘价共445个数据进行预测。本文所作的主要工作有:  一、通过基于分形理论的Hurst指数对TF指数进行检验,发现TF指数并非有效,因而根据市场有效假说,技术分析和基本面分析在这个市场均有其用武之地。  二、选择几种常见的技术指标,用指标筛选集挑选出每种TF指数技术指标在历史上表现较好的参数;同时筛选出与TF指数指标筛选集数据相关性较高的宏观经济指标。  三、分别将技术指标和技术与宏观指标结合这两种形式直接作为输入变量,通过随机森林回归对TF指数的收益率进行预测;再通过主成分分析(PCA)压缩输入变量的维数,通过随机森林回归对TF指数的收益率进行预测,这样我们得到了4个模型。  四、对上述每个模型,我们分别将GARCH模型计算出来的波动率和通过普通方差计算的历史波动率(波动率都以σ表示)乘以常数k得到以kσ作为阈值,一旦预测结果大于阈值kσ,就买入指数,并一直持有头寸,直至预测的结果小于阈值kσ便卖出平仓;一旦预测结果小于阈值-kσ,就卖空指数,并一直持有头寸,直至预测的结果大于阈值-kσ便买入平仓。  模型的结果显示,从预测值相对与真实值的误差(RMSE和MAE)来看,技术指标结合宏观经济指标作为随机森林回归输入变量总要优于仅仅使用技术指标,这也许可以归功于模型输入变量所包含的信息相对更多,同时也说明了基本面分析对于债券分析的重要性;再者,输入变量经过PCA的处理并不一能减少预测误差,这也印证了文献综述中提到的随机森林不用考虑多元回归中所涉及到的多重共线性问题,在随机森林模型中我们甚至可以加入几千个自变量。  模型的结果也显示,从利用相关交易信号进行实际投资的效果(以年化夏普比率为衡量标准)来看,技术指标结合宏观经济指标作为随机森林回归输入变量的实际投资效果总要优于仅仅使用技术指标。这与从预测值相对与真实值的误差(RMSE 和MAE)分析的结果类似。但是,与误差分析结果不同,输入变量经过PCA的处理能在一定程度上改善实际投资效果。  本文的创新之处是:在检验TF指数有效性的时候通过滚动窗口验证,增强了检验结果的可靠性;将随机森林回归方法和TF指数预测相结合;把宏观经济指标和技术指标结合起来一起作为随机森林回归输入变量,输出变量不是简单的“涨”“跌”分类,而是具体的收益率;不仅探索模型预测的精确度,而且通过特定的阈值过滤信号来进行投资,回测模型用于真实投资的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号