首页> 中国专利> 一种上市公司股价异动风险评估方法、系统及装置

一种上市公司股价异动风险评估方法、系统及装置

摘要

本发明提供了一种上市公司股价异动风险评估方法,所述方法包括如下步骤:确定评估目的;准备基础数据并提取建模指标;评估上述建模指标;建模样本划分,划分训练样本和预测样本;建立多个股价异动风险评估模型;对预测样本运用上述多个股价异动风险评估模型,存在异动风险的公司则为高风险上市公司。本发明所提供的方法基于上市公司财报、公告、所述行业、市场行情、股东持股与交易情况、舆情、宏观经济、行业政策等数据,搭建了风险评估模型,并根据评估数据预测上市公司股价在未来一定时期发生异常变化的可能性,实现了对上市公司股价异动风险的系统化、智能化、前瞻性评估和追踪研究。

著录项

  • 公开/公告号CN113065962A

    专利类型发明专利

  • 公开/公告日2021-07-02

    原文格式PDF

  • 申请/专利权人 北京安九信息技术有限公司;

    申请/专利号CN202110345151.0

  • 发明设计人 苏晶晶;

    申请日2021-03-31

  • 分类号G06Q40/04(20120101);G06Q40/06(20120101);G06Q20/40(20120101);G06Q30/02(20120101);G06Q10/06(20120101);G06K9/62(20060101);

  • 代理机构11718 北京清大紫荆知识产权代理有限公司;

  • 代理人彭一波

  • 地址 102488 北京市房山区长阳万兴路86号-N117

  • 入库时间 2023-06-19 11:42:32

说明书

技术领域

本发明涉及数据处理与计算机技术领域,尤其涉及一种上市公司股价异动风险评估模型及装置。

背景技术

现有技术中,缺乏对大批量上市公司股价异动风险的定期评估与全面追踪研究。因此,亟待发明一种用于上市公司股价异动风险评估的方法、系统及装置,实现对于全部上市公司股价异动风险的智能化、高效化、系统化研究。

发明内容

有鉴于此,本发明实施例提供了一种上市公司股价异动风险评估方法、系统及装置,至少部分解决现有技术中存在的问题。

第一方面、本发明实施例提供了一种上市公司股价异动风险评估方法,所述方法包括如下步骤:确定评估目的;准备基础数据并提取建模指标;评估上述建模指标;建模样本划分,划分训练样本和预测样本;建立多个股价异动风险评估模型;对预测样本运用上述多个股价异动风险评估模型,提示存在异动风险的公司则为高风险上市公司。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述评估目的包括确定待评估上市公司范围、评估天数以及在所述评估天数内的股价异常变化的标准。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述基础数据包括上市公司历史财务报表数据、公告数据、所属行业数据、行情数据、股东持股与交易数据、舆情数据以及宏观经济政策和行业政策数据。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述建模样本划分包括:根据评估目的,随机选取一家上市公司,提取该公司在历史任一交易日向后推N个交易日的最大振幅/跌幅数据;

将上述最大振幅/跌幅数据与M进行比较,大于等于M则标识为1,小于M标识为0;

以标识为1的对应时间段T数据为训练样本,按照1:10的比例随机选取同一时段与其同行业标识并且对应时间段T标识为0的上市公司,并提取其对应时间段数据;

将上述两部分组合构成训练样本,

其中,N为评估目的中所确定的评估天数,M为评估目的所确定的股价异动标准值。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,对所述建模指标按照上市公司财报、所属行业、行情、交易、持股、估值、解禁减持、股权质押、融资融券、行业地位和负面舆情进行分类。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述上市公司股价异动风险评估模型包括从逻辑回归模型、支持向量机模型、决策树模型、自适应增强模型、随机森林模型以及引导聚集模型中选出的一种或多种。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述逻辑回归模型的建立基于上述建模指标所得的输入变量和输出变量数据,包括如下步骤:

根据分析目的设置指标变量,其中,输出变量为y,y取值为1的概率为p,取值为0的概率为1-p,输入变量为x

在建模指标中进行数据搜集,根据数据对特征进行筛选;

对ln(p/(1-p))和输入变量列出线性回归方程,估计模型回归系数,

进行回归模型、回归系数的显著性检验和拟合优度检验;

根据上述计算的回归系数,评估预测样本在未来一段时间存在异动风险的概率,筛选出异动风险较高的上市公司名单。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述支持向量机模型的建立基于上述建模指标所得的输入变量和输出变量数据,包括如下步骤:

将输入变量记为X=(X

寻找最大边界超平面;

根据上述获得的模型,对预测样本进行评估建模,筛选出异动风险较高的上市公司名单。找到最大边界超平面b+W

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述决策树模型的建立基于上述建模指标所得的输入变量和输出变量数据,若数据(x

采用递归二叉分裂法在训练集中生成一棵分类树;

对大树进行代价复杂性剪枝,得到一系列最优子树,子树是α的函数,利用K折交叉验证选择α,找出此α对应的子树。

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述自适应增强模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

初始化样本抽样权重w

对m=1,...,M,以w

运用h(x;T

计算

重新计算样本抽样权重w

通过投票建立加权函数

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述随机森林模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

对训练集T进行Bootstrap抽样,得到一个样本量为n的训练样本集T

对T

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述引导聚集模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

对训练集T进行Bootstrap抽样,得到B个样本量为n的训练样本集{T

分别对B个训练集建立决策树模型得到分类回归树h(x;T

本发明所提供的上市公司股价异动风险评估方法,还具有这样的特征,所述方法还包括对股价异动风险评估结果的展示分析、分析报告的生成和输出。

第二方面,本发明还提供了一种上市公司股价异动风险评估系统,所述系统包括依次连接的数据存储模块、数据清洗与预处理模块、数据分析与挖掘模块、模型效果评估模块以及数据展示与发布模块。

进一步的,所述系统用于实现如前述任一项所述的评估方法。

第三方面,本发明还提供了一种上市公司股价异动风险评估装置,所述装置包括处理器,所述处理器被配置为执行前述任一项所述的评估方法。

有益效果

本发明所提供的上市公司股价异动风险评估方法基于上市公司财报、公告、所述行业、市场行情、股东持股与交易情况、舆情、宏观经济、行业政策等数据,搭建了风险评估模型,并根据评估数据预测上市公司股价在未来一定时期发生异常变化的可能性,实现了对上市公司股价异动风险的系统化、智能化、前瞻性评估和追踪研究。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的上市公司股价异动风险评估方法的流程图;

图2为本发明实施例提供的一种上市公司股价异动风险系统的模块图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。

如图1所示,本发明实施例提供了一种上市公司股价异动风险评估方法,所述方法包括如下步骤:确定评估目的;准备基础数据并提取建模指标;评估上述建模指标;建模样本划分,划分训练样本和预测样本;建立多个股价异动风险评估模型;对预测样本运用上述多个股价异动风险评估模型,同时超过50%个模型提示存在异动风险的公司为高风险上市公司。建模指标的评估包括数据分布、相关性、异常值占比、缺失值占比等。

在上述实施例中,提供的上市公司股价异动风险评估方法搭建了风险评估模型,并根据评估数据预测上市公司股价在未来一定时期发生异常变化的可能性,实现了对全部上市公司股价异动风险的系统化、智能化、前瞻性评估和追踪研究。

在部分实施例中,所述评估目的包括确定待评估上市公司范围、评估天数以及在所述评估天数内的股价异常变化的标准。例如,需要评估未来N个交易日或者N个自然日的股价异动变化趋势,则N为评估天数;股价异常变化的标准为股价变化的最大振幅或者最小跌幅超过M%,则M%为异常变化的标准。

在部分实施例中,所述基础数据包括上市公司历史财务报表数据、公告数据、所属行业数据、行情数据、股东持股与交易数据、舆情数据以及宏观经济政策和行业政策数据。其中,

上述实施例中,历史数据也可以指上市公司的上一年度数据或者上一年度至前20年度数据或者上一年度至前10年数据或者上一年度至前5年数据等等,或者说可以使用该上市公司上市至今的数据。历史财务报告和公告数据从巨潮资讯或其他财经网站获取;所属行业、行情、股东持股与交易数据从万得、同花顺等金融信息服务商获取;舆情数据、宏观经济政策和行业政策数据从网络爬取,并对舆情数据、宏观经济政策和行业政策数据进行打标参与建模。

在部分实施例中,所述建模样本划分包括:根据评估目的,随机选取一家上市公司,提取该公司在历史任一交易日向后推N个交易日的最大振幅/跌幅数据;

将上述最大振幅/跌幅数据与M进行比较,大于等于M则标识为1,小于M标识为0;

以标识为1的对应时间段T数据为训练样本,按照1:10的比例随机选取同一时段与其同行业标识并且在对应时间段T标识为0的上市公司,并提取其对应时间段数据;

将上述两部分组合构成训练样本,

其中,N为评估目的中所确定的评估天数,M为评估目的所确定的股价异动标准值。

在上述实施例中,举例说明建模样本的划分,将20%设定为股价异动标准,上市公司A,在1年内,有5个时间段股价振动幅度超过20%,此时在与上市公司A同行业的上市公司中挑出在前述5个时间段股价波动振幅不超过20%的10个公司,将这10个公司以及A公司的这5个时间段的数据作为训练样本,输入模型进行训练学习,而预测样本为评估目的中确定的所有待评估上市公司,本公开实施例对所有待评估上市公司从最近交易日开始预测。

在部分实施例中,对所述建模指标按照上市公司财报、所属行业、行情、交易、持股、估值、解禁减持、股权质押、融资融券、行业地位和负面舆情进行分类。

在部分实施例中,所述上市公司股价异动风险评估模型包括从逻辑回归模型、支持向量机模型、决策树模型、自适应增强模型、随机森林模型以及引导聚集模型中选出的一种或多种。在选择多种评估模型来预测股价异动风险情况时,建立股价异动风险较高的数据集,当某上市公司同时出现一半以上被选用模型预测存在较高股价异动风险时,可以提高股价异动风险数据集获取的准确率。或者根据需要选定不同的判定标准,也可以选择只要有模型提示高风险则均存在高风险,或者选择同时有2/3以上模型提示高风险则才判定存在高风险。

在部分实施例中,所述逻辑回归模型的建立基于上述建模指标所得的输入变量和输出变量数据,包括如下步骤:

根据分析目的设置指标变量,其中,输出变量为y,y取值为1的概率为p,取值为0的概率为1-p,输入变量为x

在建模指标中进行数据搜集,根据数据对特征进行筛选;

对ln(p/(1-p))和输入变量列出线性回归方程,估计模型回归系数,

进行回归模型、回归系数的显著性检验和拟合优度检验;

根据上述计算的回归系数,评估预测样本在未来一段时间存在异动风险的概率,筛选出异动风险较高的上市公司名单。

在部分实施例中,所述支持向量机模型的建立基于上述建模指标所得的输入变量和输出变量数据,包括如下步骤:

将输入变量记为X=(X

寻找最大边界超平面;

根据上述获得的模型,对预测样本进行评估建模,筛选出异动风险较高的上市公司名单。找到最大边界超平面b+W

在部分实施例中,所述决策树模型的建立基于上述建模指标所得的输入变量和输出变量数据,若数据(x

采用递归二叉分裂法在训练集中生成一棵分类树;

对大树进行代价复杂性剪枝,得到一系列最优子树,子树是α的函数,利用K折交叉验证选择α,找出此α对应的子树。

在上述实施例中,对预测样本进行评估建模,筛选出异动风险较高的上市公司名单,令

在部分实施例中,所述自适应增强模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

初始化样本抽样权重w

对m=1,...,M,以w

运用h(x;T

计算

重新计算样本抽样权重w

通过投票建立加权函数

在部分实施例中,所述随机森林模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

对训练集T进行Bootstrap抽样,得到一个样本量为n的训练样本集T

对T

在上述实施例中,在对预测样本进行预测时,由每个决策树得到一个预测结果,再进行投票得出最后结果。对于分类问题,最终的预测结果为所有决策树预测结果中最多的那类

在部分实施例中,所述引导聚集模型的建立基于上述建模指标所得的输入变量和输出变量数据,将训练样本集T设定为{(x

对训练集T进行Bootstrap抽样,得到B个样本量为n的训练样本集{T

分别对B个训练集建立决策树模型得到分类回归树h(x;T

在上述实施例中,在对预测样本进行预测时,由每个决策树得到一个预测结果,再进行投票得出最后结果。对于分类问题,最终的预测结果为所有决策树预测结果中最多的那类

在部分实施例中,所述方法还包括对股价异动风险评估结果的展示分析、分析报告的生成和输出。对于特定上市公司,分类显示其在行情、交易、持股、估值、解禁减持、股价质押、融资融券、行业地位、负面舆情等指标取值,形成正式风险评估报告,并发送至监控终端。

第二方面,本发明还提供了一种上市公司股价异动风险评估系统,所述系统包括依次连接的数据存储模块、数据清洗与预处理模块、数据分析与挖掘模块、模型效果评估模块以及数据展示与发布模块。模型效果评估模块用于对该系统中所建立的模型的效果进行评估,定期对过去R个工作日的模型预测效果进行回溯研究,评估每个模型的预测准确率,并基于此调整入选模型范围。

进一步的,所述系统用于实现如前述任一项所述的评估方法。

第三方面,本发明还提供了一种上市公司股价异动风险评估装置,所述装置包括处理器,所述处理器被配置为执行前述任一项所述的评估方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号