首页> 中国专利> 一种多维度分类标识的量化模型和选股方法

一种多维度分类标识的量化模型和选股方法

摘要

本发明公开了一种股票多维度分类标识的量化模型和选股方法。所述方法包括:根据需求获取股票数据信息;对数据进行纠错和清洗,加工产生次生数据;提取关键要素数据并构建企业经营的量化维度和分析模型,进行量化定义并进行文本标签分类管理;对企业发展潜力进行量化要素提取和构建模型,推演未来发展情况并进行文本标签化管理;提取风险方面的数据并构建股票风险识别模型,输出股票风险类别标签和数据文本;对交易行为数据进行归类并构建交易行为量化模型,对个股交易情况进行文本标签化管理;模块化输出各个环节量化标签文本和要素数据,提供简便快捷的分析结果为投资决策提供客观、严谨、全面的观察角度,帮助其提高投资分析效率、准确性。

著录项

  • 公开/公告号CN114913020A

    专利类型发明专利

  • 公开/公告日2022-08-16

    原文格式PDF

  • 申请/专利权人 贺雄军;

    申请/专利号CN202110180721.5

  • 发明设计人 贺雄军;

    申请日2021-02-08

  • 分类号G06Q40/06(2012.01);G06Q10/06(2012.01);G06F16/35(2019.01);

  • 代理机构

  • 代理人

  • 地址 541508 广西壮族自治区桂林市全州县才湾镇驿马村委贺家湾村15-4号

  • 入库时间 2023-06-19 16:23:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-02

    实质审查的生效 IPC(主分类):G06Q40/06 专利申请号:2021101807215 申请日:20210208

    实质审查的生效

说明书

技术领域

本发明涉及公司经营分析、股票交易数据的信息处理技术,构建了企业经营、成长潜力、风险识别、交易行为等多个体系的量化分析模型,用标签化文本数据直观呈现股票的状态。

背景技术

随着证券市场注册制的推进,上市公司数量越来越多,投资者所要面对的股票越来越多,所面临的股票分析信息越来越多。监管政策和法规越来越明细,上市公司发布的公开信息也越来越透明、越来越多,投资者需要解读的信息量越来越大。在信息不断堆积、衍生的过程中,投资者如何快速的处理信息并获取有效信息辅助决策就变得尤为重要。目前的证券类软件和系统仅仅是对股票信息进行了收集、存储和呈现,并没有对公司经营、股票数据进行特征化描述,更没有进行深度加工,并没有改善投资者认知企业和解读股票的情况,并没有减少投资者获取和解读信息的负担。

证券市场信息在不断地熵增,熵增为投资者带来了负担,如何实现有效地甄选成为证券投资者的难题。证券投资决策本身包含了趋利避害、预研未来的属性,一种有效的信息处理方法和量化分析模型能够帮助投资者提高解读公司和股票的效率、快速获取更高确定性机会,将会为投资者节约更多时间和精力。

发明内容

为了有效解决上述问题:快速了解股票特点和状态,鉴别股票价值,识别优劣。本发明目的是提供一种多层面多角度的信息量化处理模型并输出便于投资者更容易理解和使用的标签化文本、数据信息和模型图谱。

本发明采取的技术是一种多层面标签化分类的量化模型和选股方法,包括如下步骤:

首先,从沪深交易所、上市公司官方渠道、各大证券数据软件平台等获取企业基础信息、各季度财务报告、负债表、利润表、现金流表、上市公司公告、调研纪要、股票交易行为和行为数据等。

进一步地,对下载数据进行初步清洗,一方面检查数据下载过程中发生的误差,一方面用多个条件淘汰一部分未满足条件的个股,不对其进行价值判断。

对清洗后的部分数据进行二次加工生成一些新的次生数据,用清洗后的下载数据和二次加工后的次生数据对公司经营能力、成长潜力、风险识别、交易行为等多个层面进行判断分析(数据处理步骤示意图如图2)。

进一步地,构建一个企业经营分析模型,模型细分企业能力、产品营收、毛利变化、市场推广、客户质量、运营管理、货币资金、借款回报、账面盈余、员工招扩、生产销售、投产效率、扩张潜力等多个角度,每个角度从财务报表中提取关键要素,用二元条件函数进行条件判断,符合相应条件则输出对应预设文本标签。

二元条件函数为:

上述函数起到分选归类的作用:满足条件(X≥a,y≥b)则输出文本标签A1;满足条件(X≥a,y<b)则输出文本标签A2;满足条件(X<a,y≥b)则输出文本标签A3;满足条件(X<a,y<b)则输出文本标签A;a为关键因子x的一个常数值,b为关键因子Y的一个常数值,A1、A2、A3、A4为预设文本标签。

n个角度组建起一个n*4的企业经营分析矩阵模型(示意图如图3),对个股的n个角度进行模型条件判断后输出的文本标签进行汇总及输出个股模型特征优劣分类图谱。

进一步地,构建一个发展潜力分析模型,成长潜力模型包括过去三年关键因子(资产、营业收入、净利润)的复合增长情况、最新一期财务报告的关键因子(资产增长率、营业收入增长率、净利润增长率)的情况、最新一期财务报告的估值因子(市净率、市销率、市盈率)情况以及未来判断因子(包括未来季度增长因子、未来年度增长因子、未来两三年增长因子等)情况,发展潜力分析模型的关键因子是与企业资产、营业收入、利润、价格、产能等相关联的变动情况,其主要目的是测算企业未来成长空间,落实季度、半年、年度、两三年等未来不同时间企业成长潜力空间情况。

每一个维度的判断因子函数式,如下:

上述函数起到特征鉴别的作用:关键因子x满足条件a

n个维度的关键因子构建起一个n*a

进一步地,构建一个风险识别模型,风险识别模型用原始数据进行处理后的次生数据构建关键要素,比如员工人数、商誉利润比、债务市值比、董监高增减持比例、监管违规、分红融资比、净资产增减、资产收益率、经营现金流量净额、货币资金与未分配利润比、销售费用与营业收入比、前五大客户占比等数据,继而对提取的关键因子进行条件函数判断并输出相对应的判断标签文本。所采取的判断函数式为一元因子判断函数,函数式如下:

上述函数起到特征鉴别的作用:关键因子x满足条件a

n个维度的关键因子构建起一个n*a

进一步地,构建一个交易行为分析模型,交易行为分析模型包括控制形式、董监高减持行为、异常交易、流动资金、透明度、交易增量等信息和数据角度,当多个关键因子组合符合预设条件时,就输出状态描述的标签文本和数据信息。多因子判断函数式为:

上述函数起到特征鉴别和状态描绘的作用。同时,对模型中关键因子数据进行异常条件判断,发生异常现象的因子进行数据直观突出,以便直接查询和比对异常点。

用交易行为分析模型输出一个呈现个股特征和状态的文本集合,同时建立多股可对比的表格图谱,表格图谱包括格局、交易属性、态势、极限边界、减持黑洞、增仓异常、游资参与度、连涨系数等多个角度的标签文本和数据信息。

进一步地,将企业经营分析模型、成长潜力判断模型、风险识别模型、交易行为分析模型结合原始数据和次生数据优化构建一个策略参考模型。其策略参考模型中关键结果的运算方式为前文中所列模型的组合矩阵,组合矩阵函数为:

上述矩阵函数通过对各个模型矩阵的组合判断从而形成一个策略参考模型。策略参考模型包括公司经营层面的评级和标签优选、成长潜力模型的结果再判断、持股结构与资金交易数据的组合条件再判断,从而得出一系列可用于交易策略中使用的企业能力值、价值成长潜力、空间潜力、潜在风险、买卖点价格、持续能力、极限边界等方面的数据和文本标签输出。

进一步地,汇总个股的企业经营分析模型、发展潜力分析模型、风险识别模型、交易行为分析模型及策略参考模型等多个模型的标签文本和数据信息并输出;

同时,呈现全市场个股的企业经营分析模型、发展潜力分析模型、风险识别模型、交易行为分析模型及策略参考模型等多个模型的列表信息;

最终,将部分原始数据、清洗后的数据和信息、模型判断后的标签文本和数据信息按分析需求输出和展示,形成展示模块,通过智能终端进行不同时段的存储、调用、展示。

本发明由于采取以上技术方案,其具有以下优点:

本发明可以同时处理成百上千维度的数据,并自动模块化输出文本和数据信息,简化投资者和分析员的分析难度、减少工作量;其优势还在于能够综合企业经营数据和股票交易行为数据制定未来一定时间段的策略参考方案。

本发明通过对数据和信息的深度加工后,用模型进行判断处理,突出了个股某些异常因素和优劣程度,用标签化文本更直观地呈现了数据和信息所表达的内涵,降低了投资者阅读数据和信息的难度。因此,本发明可广泛应用于股票分析应用领域。

附图说明

图1为本方法的一个实施步骤结构图

图2为本方法的一个数据量化神经网络步骤示意图

图3为本方法的一个企业经营分析模型示意图

图4为本方法的一个发展潜力分析模型示意图

图5为本方法的一个企业经营分析模型案例图

图6为本方法的一个发展潜力分析模型案例图

图7为本方法的一个交易行为分析模型输出案例图

图8为本方法中模型判断后产生的一个应用案例图

具体实施方式

本发明的难点在于关键要素选取和判定以及关键要素数据信息的再加工处理过程。下面结合附图和实施案例,对本发明作进一步详细描述。特别指出的是,为了让相关专业技术人员更加容易理解本发明,下面通过解释说明和举例展示实施方式,举例内容仅仅表达展示实施的一些方式并不代表发明的全部内容。本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护范围。

图1中展示了本发明的执行步骤。S1、S2步骤为数据下载;S2步骤为处理;S3、S4、S5、S6步骤为构建多维度量化模型,可同时并列执行也可分步骤递进执行;S7步骤为汇总并输出各模块模型量化标签结果。

图2展示了本发明构建的数据量化神经网络数据处理过程和方式方法,包括数据下载、数据清洗、筛选分类、多重过滤、分类标识。神经网络数据量化处理方式方法会在企业经营分析模型、发展潜力分析模型、风险识别模型、交易行为分析模型及策略参考模型等模型的各个环节用到,是本发明重要的数据处理方法。

图1中S1步骤是根据所分析目标和结果选取相关基础数据和信息作为因子进行下载。因子:指元素、因素、成分,这里特指证券市场下载的数据和公告信息,每一个维度的数据和信息即为一个因子。

关键因子:指构建某个特定函数时采用的因子,不同函数、不同模型采用的关键因子皆不同。

图1中S2步骤最主要的技术是根据后续模型需要用原始数据组合生成次生数据。次生数据是将两个或两个以上关联的原始数据进行重新组合生成一个新的数据。比如:收盘时买一量乘以买一价得出一个压板金额,用于买单实力判断;商誉规模除以最近四个季度利润,得出一个系数值,用于商誉风险等级判断;用营业利润除以员工人数,得到一个员工人均创造利润数值,用于不同股票类比择优;诸如此类数据众多,不一一列举。

图1中S3步骤的关键是选取各个维度关键因子、运算生成次生数据、建立文本标签体系、构建企业经营分析模型。构建好分析模型后,导入相应的数据即可自动生成文本标签和模型优劣分类模块。

S3步骤提取关键要素后生成的企业经营分析模型要有直观而能简化解读财务报表的效果,如:在货币资金环节采取货币资金与净利润的两个关键要素来判断公司的财富累积情况,如果货币资金多并且最新财务报告的净利润收益也多则是判定为【赚钱王】,并贴上“赚钱王”的标签;如果货币资金少并且最新财务报告的净利润收益多则判定为【当年改善】,并输出“当年改善”标签。

其他环节(企业能力、产品营收、毛利变化、市场推广、客户质量、运营管理、货币资金、借款回报、账面盈余、员工招扩、生产销售、投产效率、扩张潜力等)也相应的有关键要素数据组合进行条件函数判断,案例片段案例图如图5。

企业经营分析模型中判断函数需要取数值的地方,优先根据客观合理性进行实践经验取数值的方式取值,其次用平均数值、中位数值或正态分布范围取数值作为次要补充方式。

图1中S4步骤的关键是选取各个维度关键因子、建立模型判断函数、构建企业发展潜力分析模型。企业发展潜力分析模型的关键因子是与企业资产、营业收入、利润、价格、产能等相关联的变动情况,其主要目的是测算企业未来成长空间,落实季度、半年、年度、两三年各维度变动情况(案例示意图如图6),模型中判断函数需要取数值的地方,优先根据客观合理性进行实践经验取数值的方式取值。

图1中S5步骤的关键是选取关键因子、运算生成次生数据、建立模型判断函数、构建风险识别模型,风险识别模型中选取的关键因子都是企业分析和股票交易中常见的风险维度,如商誉、应收账款、未分配利润、现金流量净额、营业收入增减、利润增减、资产减值、借款、关联交易、持股结构、机构增减持、控股股东增减持、证监违规等;模型中判断函数需要取数值的地方,优先根据客观合理性进行实践经验取数值的方式取值,其次用样本分布范围等间隔取数值作为次要补充方式。

图1中S6步骤构建交易行为分析模型。交易行为分析模型的分析维度包括定增计划的规模与价格、董监高增减持、控股股东增减持、机构持仓变动、成交额、波动率、资金流动、内外盘、大单金额与成交价等,交易行为模型的每一个维度的关键要素可能是多个也可能是一个因子的条件判断,比如:超大增仓就是直接用下载数据中的超大增仓比率,进行条件判断(x>a则输出“超大增仓”,a>x>b则输出标签“大增仓”,如果不满足则输出空值),如案例图7。

交易行为分析在关键因子处理上可以用异常值判断函数凸显个股异常点和优劣势,从而能够在直观明确状态并进行全市场个股比对。交易行为分析模型重在明确个股所处状态。

图1中S7步骤汇总和模块化输出内容中,在输出标签文本环节不局限于表现形式,可以是多股当日状态文本的列表(如案例图8),也可以是个股的上述各模型模块化输出,如下表中案例呈现了某股某日的部分状态描述。

上述表中出现的文本标签【突破】、【起点板】等都是对个股所处状态的特征化描述,方便快速了解状态和结构,而【见龙在田】类型的归类文本标签则是经过神经网络层层筛选组合构建的。数据量化神经网络处理过程如图2。

图1中S7步骤输出模块化信息还在于按模型结构输出企业经营分析模块、成长潜力判断模块、风险识别模块、交易行为分析模块及策略参考模块。

图1中S7步骤输出模块化信息还在于构建策略参考模型用于判断个股是否值得交易,模型中各个关键因子的选取主要依据资金行为所表征出来的实际情况,在结合前面分析模型各个维度中能够影响空间表现的因子进行量化综合判断,最终输出方便阅读的信息内容。

下表案例就是一种内容呈现形式。

本方法可以同时处理成百上千维度的数据,并模块化输出文本和数据信息,简化投资者和分析员的分析难度、减少工作量,能够综合企业经营数据和股票交易行为数据制定未来一定时间段的策略参考方案。

通过上述实施案例,本领域的技术人员清楚地知道可以借助一些软件或程序在手机、电脑和其他智能终端来落地实现,也可为后续自动化交易提供策略参考。

上述陈列的表格和举例仅仅作为本发明方法中的部分示例说明,并不用以限制本发明。凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号