首页> 中国专利> 一种基于关键股票集识别的股票市场大盘数据分析方法

一种基于关键股票集识别的股票市场大盘数据分析方法

摘要

本发明公开了一种基于关键股票集识别的股票市场大盘数据分析方法,其步骤是:1)收集数据,计算股票成交量之间的关联关系,构建股票关联网络;2)在股票关联网络中,以迭代的方式应用搜索算法识别关键股票集合;3)根据关键股票的价格走势,以成交量为权重计算大盘走势期望。本发明方法充分挖掘股票成交量之间的关联关系,能够根据股票市场的交易情况,准确判定处于活跃状态且具有影响力的股票,提高股票市场大盘走势预测的准确性。计算简单,具有时效性、灵活性和扩展性,可调整对历史数据的处理需求,适用于股票市场数据量大且股票交易变动频繁的情况。

著录项

  • 公开/公告号CN103236013A

    专利类型发明专利

  • 公开/公告日2013-08-07

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN201310167850.6

  • 发明设计人 顾庆;李孔文;陈道蓄;

    申请日2013-05-08

  • 分类号G06Q40/06;

  • 代理机构江苏圣典律师事务所;

  • 代理人贺翔

  • 地址 210007 江苏省南京市鼓楼区汉口路22号

  • 入库时间 2024-02-19 19:24:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-16

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2013101678506 申请日:20130508 授权公告日:20160330

    专利权的终止

  • 2016-03-30

    授权

    授权

  • 2013-09-04

    实质审查的生效 IPC(主分类):G06Q40/06 申请日:20130508

    实质审查的生效

  • 2013-08-07

    公开

    公开

说明书

技术领域

本发明涉及一种预测方法,特别是在股票市场中准确预测大盘走势的方法; 该方法基于股票成交量之间的关联关系,识别当前处于活跃状态且具有影响力的 关键股票,据以完成大盘走势预测。

背景技术

股票市场的大盘走势通常反映为股票价格指数的变化。为计算股票价格指 数,通行的方法是选取有代表性的一组股票,根据成交量或股价总值等对这些股 票的交易价格进行加权平均或简单算术平均,在选定的历史价格基线的基础上, 通过计算当前市价总值相对于基线总值的百分数而获得。常见的股票价格指数包 括道琼斯指数、标准普尔指数、恒生指数、上证180指数、沪深300指数等。

股票投资需要对股票未来走势的方向和可能性做出合理估计。一种可行的策 略是顺势而为,即在大盘的上涨阶段买入,在大盘即将下跌的阶段卖出,该策略 可显著提高股票投资的成功几率。另外,随着近年来股指期货的引入,对大盘走 势预测的准确性和量化要求明显提高。现有的大盘数据分析方法主要依托股票价 格指数,通过分析股票价格指数的历史数据和趋势曲线,估计股票价格指数未来 的变化。常用的手段包括用于分析股票指数波动的GARCH和OHLC技术,用于挖 掘股票指数变动规律的神经网络、马尔科夫链和支持向量机技术,以及基于股票 指数趋势曲线形状特性的分形理论、各种阳线和阴线预测技术等。

单纯从股票价格指数本身来预测大盘走势存在一定的风险。首先各种股票指 数的计算所采用的都是标准股票,不会根据股票市场当前的交易状态做调整,因 此不具有时效性;采用标准股票计算股票指数,往往对大盘上涨或下跌的趋势反 映迟钝,等到股票价格指数出现明显变动,已经即成事实,错过股票投资的最佳 时机。另外,股票市场的大盘走势风云变幻,受多种因素影响,随着买卖双方信 息对称性的提高,股票价格指数本身趋向于一个公平博弈(定义为鞅),其特征 是股票指数在下一时段的取值期望等于最近一次的观测值。这一点类似于硬币投 掷,即使历史上投掷99次都是正面朝上,第100次投掷时正面朝上的期望概率 仍然等于第99次投掷的概率。如果存在公平博弈,则仅仅根据股票价格指数的 历史数据和趋势曲线,不能准确估计股票指数的未来变化。

发明内容

本发明所要解决的技术问题是提供一种基于关键股票集识别的股票市场大 盘数据分析方法,该方法充分挖掘股票成交量之间的关联关系,能够高效、实时 地识别处于活跃状态且具有影响力的股票;同时计算简单,具有时效性和扩展性, 能够提高股票市场大盘走势预测的准确性,并且适应股票市场数据量大且股票交 易变动频繁的特点。

为实现上述目的,本发明采用如下的步骤:

1)收集股票交易数据,计算股票成交量之间的关联关系,以股票为节点、 关联关系为边构建股票关联网络;

2)在股票关联网络中,以迭代的方式应用搜索算法识别关键股票集合;

3)根据关键股票近期的价格走势,以成交量为权重,计算大盘走势期望, 估计大盘上涨或下跌的趋势。

上述步骤1)中具体过程为:首先获取股票市场近期内所有股票的交易数据; 然后对每一支股票,以天为单位,按时间顺序记录每个交易日的成交量,组成交 易向量;接下来设定时间差,根据股票前一时段和后一时段的交易向量,计算任 意两支股票成交量之间的关联关系权重;为关联关系权重设定阈值,保留权重不 低于阈值的关联关系;最后以股票为节点、关联关系为有向边构建股票关联网络, 形成一个有向图。

其中,计算两支股票的关联关系权重的方法是:以天为单位,获取连续l 个交易日内某一股票si每天的成交量,组成si的交易向量ξi=<xi,1,xi,2,...,xi,l>; 向量中的元素为采样日的股票成交量,l为向量长度;然后设定时间差t,同样 以天为单位,参数l和t根据股票市场的大盘波动情况调整,当股票市场大盘波 动剧烈,股票投资时间周期短时,l和t值相应减少,反之则相应增加;接下来 对任意两支股票si和sj,根据两者不同时段的交易向量,计算从si到sj的关 联关系权重w<i,j>,公式如下:

w<i,j>=Σk=1l(xi,k-xi)(xj,k-xj)(l-1)·σi·σj;

其中si的交易向量ξi=<xi,1,xi,2,...,xi,l>和sj的交易向量 ξj=<xj,1,xj,2,...,xj,l>取自不同的时段,sj的第一个向量元素xj,1的采样日期比 si的第一个向量元素xi,1晚t个交易日,反映股票si的成交量变化对股票sj 产生影响的程度;和分别表示交易向量ξi和ξj的均值,σi和σj则分别表示向 量的标准差;以股票si的交易向量为例,和σi的计算公式如下:

xi=1lΣk=1lxi,k

σi=1l-1Σk=1l(xi,k-xi)2;

根据计算公式,关联关系权重的取值范围是-1≤w<i,j>≤1;据此设定关联关 系权重的阈值w,保留权重不低于阈值w的关联关系。

步骤2)中具体过程为:首先确定关键股票集合的规模n,n值可随着股票 市场当前的交易规模调整,交易规模越大,n相应增加,反之则减少;然后以迭 代的方式,在股票关联网络中应用搜索算法,每次选择m个排在最前列的股票; 将选定的股票添加到关键股票集合,再从股票关联网络中删除所选股票和关联 边,进入下一轮迭代;直到选择足够数量的关键股票。

其中,应用搜索算法查找关键股票的方法是:采用PageRank算法来搜索关 键股票;给定当前的股票关联网络,即有向图G=(S,R),建立G的邻接矩阵A, 矩阵A是一个|S|×|S|的0-1矩阵,其中|S|代表股票节点集合S的规模,R为有向 边集合;矩阵A中元素aij的定义如下:

aij=1<si,sj>R0<si,sj>R;

将矩阵A的转置矩阵作为PageRank算法的输入;另外,设置PageRank算法 的阻尼系数为α=0.3。

步骤3)中根据关键股票集合计算大盘走势期望的过程是:分两个步骤;第 一步就每一支关键股票,计算其价格走势;给定关键股票si,首先获取si最近 6个交易日的收盘价,计算价格走势向量△i=<δi,1i,2,...,δi,5>,其中的元素δi,k (1≤k≤5)的计算公式如下:

然后计算Δi的向量均值代表股票si的价格走势,公式如下:

δi=15Σk=15δi,k;

第二步根据每支关键股票的价格走势,以最近6个交易日的总成交量为权 重,采用加权平均法计算股票市场大盘的走势期望;令股票si的总成交量为Qi, 关键股票的数量为m,公式如下:

本发明方法运用股票成交量之间的关联关系,构建股票关联网络;以迭代的 方式应用成熟的搜索算法,高效、实时地识别股票市场中处于活跃状态且具有影 响力的关键股票集合;通过计算关键股票的价格走势,量化估计和预测股票市场 的大盘走势。理论分析和实际数据检验表明,应用本发明方法可以有效避免在计 算股票价格指数时采用固定的标准股票,不能及时反映股票市场当前交易状态的 问题;同时避免股票指数预测中可能存在的公平博弈问题;有效提高股票市场大 盘走势预测的合理性和准确性。本发明方法计算简单,具有时效性、灵活性和扩 展性,可调整和控制对股票市场历史数据的处理需求,适用于股票市场数据量大 且股票交易变动频繁的情况,能够定量、准确和及时地完成股票市场大盘走势的 预测。

附图说明

图1是基于关键股票集识别的股票市场大盘数据分析方法的总体框架;

图2是分析股票成交量之间的关联以构建股票关联网络的处理流程;

图3是根据8支股票数据构建股票关联网络的一个示例;

图4是在股票关联网络中识别关键股票集合的处理流程;

图5是根据关键股票的价格走势计算大盘走势期望的处理流程。

具体实施方式

图1所示为基于关键股票集识别的股票市场大盘数据分析方法的总体技术 框架。方法的输入是股票市场近期内所有股票的交易数据,方法的输出是股票市 场大盘未来走势的定量预测。本发明方法包含三个处理模块:首先根据股票市场 交易数据,计算股票成交量之间的关联关系,以股票为节点、关联关系为边构建 股票关联网络;然后在股票关联网络中,以迭代的方式应用成熟的搜索算法,识 别关键股票集合;最后根据关键股票近期的价格走势,以成交量为权重,计算大 盘走势期望,估计大盘上涨或下跌的趋势。

本发明方法的第一个模块是构建股票关联网络,执行过程如图2所示。首先 获取股票市场近期内所有股票的交易数据;然后对每一支股票,以天为单位,按 时间顺序记录每个交易日的成交量,组成交易向量;接下来设定时间差,根据股 票前一时段和后一时段的交易向量,计算两支股票成交量之间的关联关系权重; 为关联关系权重设定阈值,保留权重不低于阈值的关联关系;最后以股票为节点、 关联关系为有向边构建股票关联网络,是一个有向图。

为计算两支股票的关联关系权重,首先以天为单位,获取连续l个交易日内 某一股票si每天的成交量,组成si的交易向量ξi=<xi,1,xi,2,...,xi,l>;向量中的 元素为采样日的股票成交量,l为向量长度,可设定为l=15。然后设定时间差 t,同样以天为单位,可设定为t=3。参数l和t可以根据股票市场的大盘波 动情况调整,本发明方法给出的是参考值;一般当股票市场大盘波动剧烈,股票 投资时间周期短时,l和t值相应减少,反之则相应增加。接下来对任意两支股 票si和sj,根据两者不同时段的交易向量,采用交叉相关性计算从si到sj的 关联关系权重w<i,j>,如公式(1)所示:

w<i,j>=Σk=1l(xi,k-xi)(xj,k-xj)(l-1)·σi·σj---(1)

其中si的交易向量ξi=<xi,1,xi,2,...,xi,l>和sj的交易向量

ξj=<xj,1,xj,2,...,xj,l>取自不同的时段,sj的第一个向量元素xj,1的采样日期比 si的第一个向量元素xi,1晚t个交易日,反映股票si的成交量变化对股票sj 产生影响的程度;和分别表示交易向量ξi和ξj的均值,σi和σj则分别表示向 量的标准差;以股票si的交易向量为例,和σi的计算如公式(2)所示:

xi=1lΣk=1lxi,k

σi=1l-1Σk=1l(xi,k-xi)2---(2)

股票成交量之间的关联关系是有向的,从股票si到股票sj的关联关系<si, sj>不同于从股票sj到股票si的关联关系<sj,si>;两者在计算权重时采用的 是不同的交易向量。

根据计算公式,关联关系权重的取值范围是-1≤w<i,j>≤1;最后设定关联关 系权重的阈值w,可设定为w=0.6,保留权重不低于阈值w的关联关系,用于 构建股票关联网络。

图3以8支股票在18个交易日内采样的交易数据为例,解释股票关联网络 的构建过程。表1所示的股票交易数据来源于雅虎财经,反映连续18个交易日 内各支股票的成交量。为构建股票关联网络,各参数设定为:交易向量长度l= 15,时间差t=3,权重阈值w=0.6;表2所示为两两股票间关联关系权重的 计算值,其中行代表关联关系的起始股票,列代表关联关系的目标股票。以股票 s1到股票s2的关联关系为例,s1的交易向量由1~15交易日采样的15个成交量 数据组成,而s2的交易向量由4~18交易日采样的15个成交量数据组成;按照 公式(1)和(2)计算权重w<1,2>,结果为0.763;同理计算股票s2到股票s1 的关联关系权重w<2,1>,结果为-0.177,显然两者并不相同。基于权重阈值, 去除权重不足的关联关系,所构建的股票关联网络如图3所示。

表1

单位:万股

表2

本发明方法的第二个模块是在股票关联网络中识别关键股票集合,执行过程 如图4所示。首先确定关键股票集合的规模n,设定为n=60,n值可随着股票市 场当前的交易规模调整,交易规模越大,n相应增加。然后以迭代的方式,在股 票关联网络中应用成熟的搜索算法,每次选择m个排在最前列的股票,参数m 可以设定为m=3;将选定的股票添加到关键股票集合,再从股票关联网络中删除 所选股票和关联边,进入下一轮迭代;如此处理可以减少关键股票之间互相影响 的程度,增加所选关键股票的独立性和代表性;选择足够数量的关键股票后,最 后输出关键股票集合。

按照图4,在每一次迭代中,可以采用PageRank算法来搜索关键股票。给 定当前的股票关联网络(有向图)G=(S,R),首先建立G的邻接矩阵A,是一个 |S|×|S|的0-1矩阵,其中|S|代表股票节点集合S的规模,R为有向边集合;矩阵 A中元素aij的定义如公式(3)所示:

aij=1<si,sj>R0<si,sj>R---(3)

由于PageRank算法根据链入边数量(即入度)决定节点的关键程度,而对 于股票关联网络,股票节点的关键程度决定于节点的链出边数量(即出度),因 此将矩阵A的转置矩阵作为PageRank算法的输入;另外,PageRank算法需要一 个阻尼系数α,原意代表网页浏览者随机浏览任意网页的几率,应用到股票关联 网络,代表外部随机因素对股票市场的影响程度,考虑到股票市场受各类外部因 素的影响较大,可设置为α=0.3。

本发明方法的第三个模块是根据关键股票的价格走势,计算大盘走势期望, 执行过程如图5所示。分两个步骤,第一步就每一支关键股票,计算其价格走势。 给定关键股票si,首先获取si最近6个交易日的收盘价,计算价格走势向量 △i=<δi,1i,2,...,δi,5>,其中的元素δi,k(1≤k≤5)的计算如公式(4)所示:

然后计算Δi的向量均值代表股票si的价格走势,如公式(5)所示:

δi=15Σk=15δi,k---(5)

第二步根据每支关键股票的价格走势,以最近6个交易日的总成交量为权 重,采用加权平均法计算股票市场大盘的走势期望;令股票si的总成交量为Qi, 关键股票的数量为m,公式如下:

表3所示为计算大盘走势期望的一个示例:

表3:

如表3所示,为简化处理,假设选择了股票s1~s6作为关键股票。以股票 s1为例,其6个交易日的收盘价格如表中所示,按公式(4)计算s1的价格走 势向量Δ1,可得:Δ1=<-0.110,-1.211,-2.371,0.424,-2.889>;再按公 式(5)计算向量均值可得其他股票以相同的方法计算向量均 值。最后基于各股票6个交易日的总成交量对向量均值取加权平均,按公式(6) 计算,可得大盘的走势期望为-0.299。从各支股票向量均值的偏差情况来看,当 前股市基本趋于稳定,稍显下跌趋势。

如果将股票市场视为一个动力系统,则采用本发明方法,所识别的关键股票 相当于驱动源,可以带动其他股票的交易量和走势;所计算的价格走势向量均值 相当于每支关键股票上涨或下跌的平均速度,而股票的总交易量相当于每支股票 的质量和动力;按此计算的大盘走势期望,相当于给予股票市场的一个冲量,可 据以量化推断股票市场大盘在未来的走势。

本发明方法运用股票成交量之间的关联关系,构建股票关联网络;以迭代的 方式应用成熟的搜索算法,高效、实时地识别股票市场中处于活跃状态且具有影 响力的关键股票集合;通过计算关键股票的价格走势,量化估计和预测股票市场 的大盘走势。理论分析和实际数据检验表明,应用本发明方法可以有效避免在计 算股票价格指数时采用固定的标准股票,不能及时反映股票市场当前交易状态的 问题;同时避免股票指数预测中可能存在的公平博弈问题;有效提高股票市场大 盘走势预测的合理性和准确性。本发明方法计算简单,具有时效性、灵活性和扩 展性,可调整和控制对股票市场历史数据的处理需求,适用于股票市场数据量大 且股票交易变动频繁的情况,能够定量、准确和及时地完成股票市场大盘走势的 预测。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号