首页> 中国专利> 一种股票价格走势预测方法、系统、终端以及存储介质

一种股票价格走势预测方法、系统、终端以及存储介质

摘要

本申请涉及一种股票价格走势预测方法、系统、终端以及存储介质。所述方法包括:获取股票集合在预定天数的历史交易日的原始价格特征;构建股票集合的股权网络关系图,股权网络关系图中的每一个顶点分别对应一只股票;将股票集合的历史价格特征以及股权网络关系图输入深度学习模型,深度学习模型通过图卷积神经网络对股权网络关系图上的顶点进行特征聚合和非线性变换,提取股权网络关系图上各顶点之间的相互作用,并构建股票集合的新价格特征;将股票集合的新价格特征与原始价格特征拼接后输入门控循环神经网络,得到包含时间序列特征的新特征;根据该新特征对股票集合的股票价格走势进行预测。本申请可以大大提高股票价格走势预测的精度。

著录项

  • 公开/公告号CN112365075A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 中国科学院深圳先进技术研究院;

    申请/专利号CN202011301121.1

  • 发明设计人 叶洁瑕;赵娟娟;叶可江;须成忠;

    申请日2020-11-19

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06Q40/04(20120101);G06Q40/06(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44316 深圳市科进知识产权代理事务所(普通合伙);

  • 代理人魏毅宏

  • 地址 518055 广东省深圳市南山区深圳大学城学苑大道1068号

  • 入库时间 2023-06-19 09:54:18

说明书

技术领域

本申请属于股票数据分析技术领域,特别涉及一种股票价格走势预测方法、系统、终端以及存储介质。

背景技术

随着中国经济的发展,股票市场随之不断壮大,越来越多的个人和机构投资者纷纷进入股票市场。股票市场的价格波动影响着投资者的收益,因而成为众多投资者的关注焦点。准确的股票价格预测能够带来巨大交易量和收益,然而股票市场异常复杂,股票价格变动受到多方面因素的影响,同时股票市场的数据繁多、冗杂,如何全面有效地挖掘出蕴藏在海量股票数据中的规律并准确预测股票价格走势成为一个热点技术问题。

现有技术中,传统的股票数据分析方法主要包括:

(1)基本分析;基本分析基于传统经济学理论,通过详尽分析企业内在价值、宏观经济形势、行业发展前景、企业经营状态等信息,测算上市公司的长期投资价值和边际安全,形成投资建议。基本分析认为股价波动无法预测,只能在边际足够安全情况下买入股票并长期持有。

(2)技术分析;技术分析基于传统证券学理论,以股票价格为研究对象,研究股价变化的历史图表。它认为市场行为消化一切,股价波动可以定量分析和预测,主要理论有道氏理论、波浪理论、江恩理论等。

(3)演化分析;演化分析基于演化证券学理论,将股市波动的生命运动特性作为研究对象,分析股市的代谢性、趋利性、可塑性等。它认为股价波动无法准确预测,转向为投资人建立一种全新的分析框架。

上述的传统分析方法需要分析者具备专业的金融知识和丰富的股市交易经验。而大数据时代已经催生了一系列数理统计、机器学习、深度学习等新的方法和技术,这些技术降低了对专业知识的依赖,由数据驱动而挖掘出股票价格变动中隐藏的复杂规律,因而越来越受到关注。

目前,常见的数理统计模型包括向量自回归(Vector autoregression,简称VAR)模型和条件自回归极差(Conditional autoregressive range,简称CARR)模型。但它们都需要分析股票的影响因素,一定程度上依赖于专家知识,同时它们只能简单拟合时间序列,无法处理更复杂的数据结构。

传统的支持向量机、马尔科夫链等机器学习方法能对大量的历史数据建模训练,挖掘出隐藏于数据中的股价波动的高维非线性特征,实现对股票价格进行预测。然而它们无法模拟股票数据中的长期时序特征。

深度学习方法中,循环神经网络(Recurrent Neural Network,简称RNN)及其变种可以对时间序列数据进行建模,提取股票数据中的长期依赖性。然而,该网络无法处理时序外的其他因素,比如股票之间由于各种经济业务的联系而产生的相互影响。

发明内容

本申请提供了一种股票价格走势预测方法、系统、终端以及存储介质,旨在至少在一定程度上解决现有技术中的上述技术问题之一。

为了解决上述问题,本申请提供了如下技术方案:

一种股票价格走势预测方法,包括:

获取股票集合在预定天数的历史交易日的原始价格特征;所述股票集合中至少包括两只股票;

基于先验知识构建所述股票集合的股权网络关系图,所述股权网络关系图中的每一个顶点分别对应一只股票;

将所述股票集合的历史价格特征以及股权网络关系图输入深度学习模型,所述深度学习模型通过图卷积神经网络对所述股权网络关系图上的顶点进行特征聚合和非线性变换,提取所述股权网络关系图上各顶点之间的相互作用,并构建所述股票集合的新价格特征;

将所述股票集合的新价格特征与原始价格特征拼接后输入门控循环神经网络,通过所述门控循环神经网络输出包含时间序列特征的新特征;

根据所述包含时间序列特征的新特征对所述股票集合的股票价格走势进行预测。

本申请实施例采取的技术方案还包括:所述获取股票集合在预定天数个历史交易日的原始价格特征包括:

对所述原始价格特征进行Z-score归一化处理;

所述原始价格特征包括收盘价、开盘价、交易量以及交易换手率。

本申请实施例采取的技术方案还包括:所述股权网络关系图包括股权关系图、行业关系图以及话题关系图,具体为:

G

G

G

上述公式中,G

本申请实施例采取的技术方案还包括:所述图卷积神经网络对所述股权网络关系图上的顶点进行特征聚合和非线性变换具体为:

根据所述股票网络关系图的拉普拉斯矩阵提取股票集合在各个关系图中的相互作用,所述图卷积神经网络的每一层公式为:

上述公式中,拉普拉斯矩阵{L

所述原始价格特征

本申请实施例采取的技术方案还包括:所述通过所述门控循环神经网络的隐藏层为:

上述公式中,输入时间步t∈[d-P+1,…,d-1],

本申请实施例采取的技术方案还包括:所述根据所述包含时间序列特征的新特征对所述股票集合的股票价格走势进行预测具体为:

将所述门控循环神经网络输出的新特征输入到带有Sigmoid激活函数的全连接层,通过所述全连接层生成股票集合的涨跌概率,公式如下:

上述公式中,

本申请实施例采取的技术方案还包括:所述深度学习模型使用交叉熵为损失函数,具体如下:

上述公式中,

本申请实施例采取的另一技术方案为:一种股票价格走势预测系统,包括:

数据获取模块:用于获取股票集合在预定天数的历史交易日的原始价格特征;所述股票集合中至少包括两只股票;

关系图构建模块:用于基于先验知识构建所述股票集合的股权网络关系图,所述股权网络关系图中的每一个顶点分别对应一只股票;

图卷积模块:用于将所述股票集合的历史价格特征以及股权网络关系图输入深度学习模型,所述深度学习模型通过图卷积神经网络对所述股权网络关系图上的顶点进行特征聚合和非线性变换,提取所述股权网络关系图上各顶点之间的相互作用,并构建所述股票集合的新价格特征;

时序特征提取模块:用于将所述股票集合的新价格特征与原始价格特征拼接后输入门控循环神经网络,通过所述门控循环神经网络输出包含时间序列特征的新特征;

结果输出模块:用于根据所述包含时间序列特征的新特征对所述股票集合的股票价格走势进行预测。

本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,

所述存储器存储有用于实现所述股票价格走势预测方法的程序指令;

所述处理器用于执行所述存储器存储的所述程序指令以控制股票价格走势预测。

本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述股票价格走势预测方法。

相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的股票价格走势预测方法、系统、终端及存储介质通过多角度(股权、行业、话题)去刻画股票之间的关系,并结合股票的历史价格特征,使用图卷积神经网络提取股票价格之间的交叉影响,捕获股票价格之间的相互作用,并基于此构建新的价格特征。将新的价格特征和历史价格特征拼接后通过门控循环神经网络提取股票的时序特征和交叉影响特征,进而进行股票价格走势预测。本发明实施例充分考虑了股票价格之间的相互作用对股票涨跌的影响,并提取了价格数据中的时序特征和交叉影响特征,从而大大提高股票价格走势预测的精度。

附图说明

图1是本申请实施例基于图的深度学习模型的系统原理图;

图2是本申请实施例的股票价格走势预测方法的流程图;

图3为本申请实施例的股票价格走势预测系统结构示意图;

图4为本申请实施例的终端结构示意图;

图5为本申请实施例的存储介质的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

针对现有技术的不足,本申请实施例的股票价格走势预测方法通过搭建一个基于图的深度学习模型,将相互影响的股票基于三种关系网络构建为股权关系图、行业关系图和话题关系图。在各个图上,结合股票的历史价格特征,使用图卷积神经网络模拟股票价格之间的交叉影响,捕获股票价格之间的相互作用,并基于此构建新的价格特征。将新的价格特征和历史价格特征一起输入门控循环神经网络中提取股票的时序特征和交叉影响特征,进而进行股票价格走势预测。如图1所示,是本申请实施例基于图的深度学习模型的系统原理图。模型公式如下:

式(1)中,d为预测股票价格走势的交易日,P为用于预测的历史交易日天数,

图1中,深度学习模型包括多关系驱动的图卷积神经网络Multi-GCN、门控循环神经网络GRU和全连接层FC。模型的输入为股票集合S在过去P个交易日的历史价格数据以及股票集合S的股权网络关系图,经过图卷积神经网络Multi-GCN聚合后输出股票集合S的新价格特征,将股票集合S的原始价格特征和新价格特征进行拼接后得到总价格特征,将总价格特征输入门控循环神经网络GRU提取股票的时间序列特征,并输出股票集合S的新特征,将新特征输入带有Sigmoid激活函数的全连接层FC,得到股票集合S在第d天的股票价格走势预测结果。

请参阅图2,是本申请实施例的股票价格走势预测方法的流程图。本申请实施例的股票价格走势预测方法包括以下步骤:

S10:获取股票集合S在过去P个历史交易日的原始价格特征,并对原始价格特征进行Z-score归一化处理;

本步骤中,股票集合S中包括N只股票,每只股票有F个原始价格特征,原始价格特征包括但不限于收盘价、开盘价、交易量以及交易换手率等。

S20:基于先验知识构建股票集合S中各只股票之间的影响关系,基于影响关系构建股票集合S的股权网络关系图;

本步骤中,通过基于先验知识构建的股权网络关系图包括股权关系图、行业关系图以及话题关系图,可以刻画股票集合S中各只股票之间复杂的交叉影响。股权关系图、行业关系图以及话题关系图具体如下:

G

G

G

公式(2)、(3)、(4)中,G

进一步地,股权关系图用于反映股票之间由于其公司相互持股而产生的价格相互影响的现象。例如,如果两家上市公司i和j之间有股权关系,则i和j所对应的股票之间存在有向边,边的权重为持股比例;反之,如果两家上市公司之间没有股权关系,则它们之间不存在边。股权比例的取值是[0,1],边的取值也是a

行业关系图用于反映股票之间由于所在行业以及公司规模所带来的股票价格相互作用。股票市场存在著名的超前-滞后现象,即行业内一些龙头股票超前或滞后地对其他股票价格造成的影响。超前-滞后现象的一个理论解释是股票市场上新的信息一般会反映在龙头股票的交易中,然后再传导到其他股票,且在同一个行业内,规模大的龙头股票价格一般引领着规模小的股票发生变化。基于该理论,本发明实施例根据以下规则分析股票之间由于所在行业以及公司规模所带来的股票价格相互作用:如果两家上市公司i和j位于不同行业,则它们的股票价格相互影响强度为a

话题关系图用于反映新闻等话题对股票价格的显著影响。通常,一只股票会对类似的、属于同一个话题的新闻作出反应。同时,同一话题的新闻会影响一群相关股票,引发股票相似的波动。例如,2019的新冠病毒新闻影响了医药类股票、娱乐类股票以及餐饮类股票。本发明实施例用股票的拥有的共同概念数目表示话题关系,从而刻画股票之间由于受到相同话题影响而在价格上出现的相似的波动趋势。具体为:如果上市公司i拥有M

S30:将股票集合S在过去P个交易日的历史价格特征以及股票集合S的股权网络关系图输入深度学习模型,深度学习模型通过图卷积神经网络对各个图上的顶点进行特征聚合和非线性变换,提取到各个图上各顶点之间的相互作用,构建每个历史交易日t中包含股票之间相互作用的新价格特征;

本步骤中,图卷积神经网络根据股票网络关系图的拉普拉斯矩阵提取股票在各种关系图中的相互作用,图卷积神经网络的每一层公式如下:

公式(5)中,拉普拉斯矩阵{L

在第t个交易日的原始价格特征

S40:将股票集合S的原始价格特征和新价格特征进行拼接后,输入门控循环神经网络提取股票集合S的时间序列特征,并输出包含时间序列特征的新特征;

本步骤中,使用门控循环神经网络GRU对过去P个历史交易日的原始价格特征X

公式(6)中,输入时间步t∈[d-P+1,…,d-1]。

S50:将门控循环神经网络输出的新特征输入到带有Sigmoid激活函数的全连接层,得到股票集合S在交易日d的股票价格走势;

本步骤中,通过使用一个全连接层FC生成股票集合S的涨跌概率,公式如下:

公式(7)中,

公式(8)中,

基于上述,本申请实施例的股票价格走势预测方法通过多角度(股权、行业、话题)去刻画股票之间的关系,并结合股票的历史价格特征,使用图卷积神经网络提取股票价格之间的交叉影响,捕获股票价格之间的相互作用,并基于此构建新的价格特征。将新的价格特征和历史价格特征拼接后通过门控循环神经网络提取股票的时序特征和交叉影响特征,进而进行股票价格走势预测。相对于现有技术,本发明实施例充分考虑了股票价格之间的相互作用对股票涨跌的影响,并提取了价格数据中的时序特征和交叉影响特征,从而大大提高股票价格走势预测的精度。

请参阅图3,是本申请实施例的股票价格走势预测系统的结构示意图。本申请实施例的股票价格走势预测系统40包括:

数据获取模块41:用于获取股票集合在预定天数个历史交易日的原始价格特征;所述股票集合中至少包括两只股票;

关系图构建模块42:用于基于先验知识构建所述股票集合的股权网络关系图,所述股权网络关系图中的每一个顶点分别对应一只股票;

图卷积模块43:用于将所述股票集合的历史价格特征以及股权网络关系图输入深度学习模型,所述深度学习模型通过图卷积神经网络对所述股权网络关系图上的顶点进行特征聚合和非线性变换,提取所述股权网络关系图上各顶点之间的相互作用,并构建所述股票集合的新价格特征;

时序特征提取模块44:用于将所述股票集合的新价格特征与原始价格特征拼接后输入门控循环神经网络,通过所述门控循环神经网络输出包含时间序列特征的新特征;

结果输出模块45:用于根据所述包含时间序列特征的新特征对所述股票集合的股票价格走势进行预测。

请参阅图4,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。

存储器52存储有用于实现上述股票价格走势预测方法的程序指令。

处理器51用于执行存储器52存储的程序指令以控制股票价格走势预测。

其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

请参阅图5,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号