首页> 中国专利> 一种基于新媒体数据的资产风控方法及设备

一种基于新媒体数据的资产风控方法及设备

摘要

本发明涉及企业市值风险监控,更具体的说是一种基于新媒体数据的资产风控方法及设备,一种基于新媒体数据的资产风控方法,步骤一:从服务器获得企业的财务数据、新媒体舆情数据以及交易数据;步骤二:对对财务数据和交易数据进行预处理,对新媒体舆情数据按照来源和事件主体进行归纳,并对舆情数据进行预处理;步骤三:输入处于监控中企业对应的财务数据、交易数据及新媒体流量矩阵中对应的数据,通过训练好的模型预测其在未来固定时间段内市值波动是否超过安全范围。若波动高于安全范围,则发出预警信号。

著录项

  • 公开/公告号CN113222471A

    专利类型发明专利

  • 公开/公告日2021-08-06

    原文格式PDF

  • 申请/专利权人 西安交通大学;哈尔滨工业大学;

    申请/专利号CN202110623218.2

  • 申请日2021-06-04

  • 分类号G06Q10/06(20120101);G06Q40/00(20120101);G06Q40/04(20120101);G06F40/289(20200101);G06F16/36(20190101);G06F16/35(20190101);G06F16/23(20190101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11466 北京君恒知识产权代理有限公司;

  • 代理人王恒

  • 地址 710049 陕西省西安市咸宁西路28号

  • 入库时间 2023-06-19 12:07:15

说明书

技术领域

本发明涉及企业市值风险监控,更具体的说是一种基于新媒体数据的资产风控方法及设备。

背景技术

新媒体主要是指利用数字技术、网络技术,通过互联网、宽带局域网、无线通信网、卫星等道,以及电脑、手机、数字电视机等终端,向用户提供信息和娱乐服务的传播形态。由于新媒体与公众举例更近,且内容筛选更聚焦大众需求,因而,新媒体中的企业舆情在传播效率和影响能力都较传统媒体时代有显著提升。近年来,新媒体中的企业舆情监控对企业公共关系部门的重要性不断提高,为企业市场营销、品牌塑造、危机应对和市值管理等均具有重要意义。对舆情内容的有效识别能够显著提升上市公司对自身口碑的认识,识别企业发展中的风险要素,了解利益相关者诉求,最终实现对企业市值的风险管控需求。

尽管,已有的市值监测能够通过企业市值数据对市值风险进行监测,但其使用的数据维度十分有限,对意外事件的预测能力不足以。

此外,舆情监测系统产品能够实现数据采集、内容存储和查询以及基于自然语言处理技术的基本分析,其提出的分析成果,包含:情绪水平、话题声量、话题生命等,但其成果由于缺乏基于金融学和传播学的理论支撑,难以对应企业市值管理的需求为企业管理者提供有针对性的建议。

发明内容

本发明的目的是提供一种基于新媒体数据的资产风控方法及设备,能够实现对企业新媒体舆情数据的采集、归纳以及潜在风险识别,从而为企业提供基于当前舆情结果下的市值波动预测,从而能更好、更有效地辅助企业防范市值风险。

本发明的目的通过以下技术方案来实现:

一种基于新媒体数据的资产风控方法,该方法包括以下步骤:

步骤一:从服务器获得企业的财务数据、新媒体舆情数据以及交易数据。

步骤二:按照企业风控需求设定日市值波动的安全范围,标注企业市值风险;若,市值波动在安全范围内设为1,反之则为0。对财务数据和交易数据进行预处理,对新媒体舆情数据按照来源和事件主体进行归纳,并对舆情数据进行预处理;进而,计算各类舆情内容的流量并依据情感词汇本体库计算内容对应的细粒度情感(如好、乐、哀、怒、惊、惧、悲)强度,整合各类型内容流量和情感强度构建企业新媒体流量矩阵;将标注后的企业市值风险水平、财务数据、交易数据及新媒体流量矩阵所对应的流量及情感数据整合成为资产风控数据集,其中包括训练集和测试集;将训练集输入深度神经网络进行训练。

步骤三:输入处于监控中企业对应的财务数据、交易数据及新媒体流量矩阵中对应的数据,通过训练好的模型预测其在未来固定时间段内市值波动是否超过安全范围。若波动高于安全范围,则发出预警信号。

步骤一中,在企业市值波动安全阈值的确定上,本专利的一个实施例采用短期股价波动和企业短期特质风险两个指标。以企业过去一年的两种市值风险测度为基础,取过去一年分布中的上25%分位数的短期股价波动和企业短期特质风险对应值作为企业市值波动安全范围的上限。

步骤二中,对财务数据和交易数据进行的预处理操作包括:

对企业的财务数据按照企业财务季度完成更新入库,其中包含企业的操控性应计项目数量、总资产收益率、公司资产规模、雇员数量、产权性质、流动负债等关键指标。

对企业的交易数据分别按天完成更新入库,其中包括企业市值、换手率、日收益率等关键指标。

按天对数据进行重整,对缺失数据采用滑动平均法进行填充,按照财务数据特征和交易数据特征构建多维特征向量

步骤二中,对应舆情数据将数据来源归纳为以下五类:官媒、主流商业媒体、有影响力的财经自媒体、高影响力非财经自媒体以及普通自媒体;

自媒体影响力得分按照粉丝数、内容更新频率、内容平均阅读量等指标进行打分取得;

官媒对应以《中国证券报》、《证券日报》、《证券时报》、《上海证券报》为代表的由官方控制的媒体,其新媒体数据对应上述机构及其旗下机构运营的媒体账号。

主流商业媒体对应《中国经营报》、《第一财经日报》、《经济观察报》、《21世纪经济报道》等以市场导向型的媒体,其新媒体数据对应上述机构及其旗下机构运营的媒体账号。

其他媒体账号对应自媒体账号,其中包含企业自营的媒体账号。

自媒体影响力的计算步骤包括:

(1)根据自媒体名称对其在各新媒体平台的粉丝数量逐日进行更新。

(2)结合同名自媒体在各新媒体内的账号群体计算其每日对应的各平台平均更新频率和最近一周更新内容的平均阅读量。

(3)对更新内容按照体裁即文本、音频和视频三类进行归纳,计算其每日更新的数量,构建影响力的特征向量如下:

media

(4)基于上述指标,采用DBSCAN聚类算法,按照特征分布的密度,将自媒体划分为2类,包含较高粉丝数量、更新频率较高且对应高阅读量的账号对应高影响力类别,反之则为低影响力类别。

自媒体是否属于高影响力的财经自媒体的计算步骤包括:

(1)对归属于高影响力类别的自媒体最近一个月的内容进行归纳,去除停用词并进行分词,本文实施例中使用jieba分词程序包对应的分析结果。

(2)以各企业年报披露中出现的各类企业业绩与财务指标构建关键词词库,将自媒体内容的分词结果与之进行对比。若重合的关键词数目超过自媒体内容分词结果关键词数量的20%,且重合的关键词总数超过自媒体内容分词总词频的10%,则定义该自媒体为财经类别的自媒体。

(3)按照上述流程逐月对自媒体是否归属财经类别进行更新。

来源的更新包括如下计算步骤:

对数据采集过程中出现的新的自媒体账号,首先计算其自媒体影响力,若不符合高影响力类别,则仅将其归纳为普通自媒体;若符合高影响力类别,则将进一步判定其是否属于财经自媒体,若符合判定条件,则定义为高影响力财经自媒体,反之则定义为高影响力非财经自媒体。

步骤二中,对新媒体数据的预处理包括如下计算过程:

(1)对新媒体内容去除停用词,并进行分词。按照词频对分词结果进行排序。

(2)按照分词结果对归属于企业业绩和财务分析类别的关键词总数进行计算,定义其数量为L1。

(3)按照分词结果对归属于高管及主要人员行动的关键词总数进行计算,定义其数量为L2。

(4)按照分词结果对归属于企业营销业务的关键词总数进行计算,定义其数量为L3。

若L1、L2、L3均等于0,则该新媒体内容不属于任何类别,剔除这一内容,不划分到新媒体流量矩阵进行进一步运算。

若L1高于L2与L3之和,则认定该内容属于企业业绩与财务分析类别;同理,若L2高于L1与L3之和,则认定该内容属于高管及主要人员行动类别;若L3高于L1与L2之和,则认定该内容属于企业营销业务类别。

上述预处理过程,需对新媒体内容划分所使用的词库进行构建,词库构建过程如下:

(1)针对企业业绩和财务分析类别内的关键词,基于证监会等其他监管机构发布的企业披露信息对应的政策与规范要求等文件,由上市公司季报、年报文本中财务信息对应的关键词构成;

(2)针对高管及主要人员行动的关键词,对应上市公司披露文件,尤其是年报中公布的企业高层管理人员、董事会成员等企业主要人员;

(3)针对企业营销业务的关键词,由上市公司季报、年报中为企业带来营业收入的关键产品和业务构成。

上述预处理过程,还需对新媒体内容划分所使用的词库进行更新,更新过程如下:

(1)对新媒体内容中出现的新名词,若出自证监会等其他监管机构发布的企业披露信息对应的政策与规范要求等文件,则划归到企业业绩和财务分析类别。

(2)对企业公布的主要人员变更,将新人名划归到高管及主要人员类别,同时替换掉原职务对应人。

(3)对应企业营销业务的关键词,若新名词对应利益相关者对企业、主营业务和产品等的昵称、别称,如米哈游对应的“米忽悠”等,则直接扩充进企业营销业务类别对应的词库中。

综上,新媒体流量矩阵的框架对应新媒体内容的5种来源及3种内容类别,进一步构建矩阵中涉及的流量和情感强度。

步骤二中,对新媒体数据的情感强度的计算对应如下过程:

(1)本文按照新媒体流量矩阵中的内容,基于大连理工大学依据本土化要求开发的Ekman情感本体词库,结合自然语言处理技术,将分词后的各类情感词汇进行匹配,计算每个矩阵内元素各情感类别对应的情感词汇频数e

(2)将每一个矩阵内元素的各情感类别对应的情感词汇频数占对应内容的情感词汇总数的比例,取得每个矩阵内要素对应的情感强度ed

综上完成了对新媒体流量矩阵的构建。

进一步,步骤2中还包含对神经网络模型的训练。企业财务数据、交易数据及新媒体流量矩阵所对应的流量及情感数据用多维特征向量

使用当前输入M

输入门

信息门控

忘记门控

输出

若z

作为其中一种实施方式,所述根据舆情数据按照来源和事件主体进行归类,构建企业新媒体流量矩阵,并对矩阵内流量数据及情感倾向进行计算的步骤包括:

依据系统自建的主体来源库对每日新媒体舆情数据的来源进行核实,并按照官媒、主流商业媒体、有影响力的财经自媒体、其他类型的高影响力自媒体以及普通自媒体五种类型进行划分,同时更新主体来源库中自媒体主体的信息。

对新媒体数据进行去除停用词并进行分词,按照分词结果对舆情对应主要事件归纳至企业业绩与财务分析;高管及主要人员行动和企业营销业务三类,集合来源划分结果,完成新媒体流量矩阵的构建。同时,对分词中出现的新词汇重新整理,更新事件主体对应的词库。

对归化在矩阵中各个子集的舆情数据的流量进行计算,并利用自然语言处理方法确定各个自己的各类情感倾向占比,将上述数据按照从主体来源到事件主体,从流量到流量对应的各类情感强度的顺序进行入库。

企业市值波动预测的模型参数计算为,利用所述每组企业样本数据中的财务数据、交易数据和新媒体流量矩阵对应的特征及所述市值波动是否在安全范围的数据标签,训练所述长短期记忆神经网络模型(LSTM),获得所述长短期记忆神经网络模型(LSTM)学习多个所述数据特征与数据标签的特征关系,得到所述经过训练的长短期记忆神经网络模型(LSTM)。

一种基于新媒体数据的资产风控设备,包括处理模块及存储模块,还包括固化在存储模块中的市值波动预警装置。

市值波动预警装置包括用于获取训练数据集的获取单元和用于利用训练数据集训练神经网络模型的训练单元。

市值波动预警装置还包括用于对测试样本使用经过训练神经网络模型进行测试的测试单元,用于根据测试结果中市值波动是否处于安全范围标签与市值波动是否真实处于安全范围标签差值的优化单元。

一种基于新媒体数据的资产风控可读存储介质,可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,计算机执行如基于新媒体数据的企业市值风险监控方法。

本发明一种基于新媒体数据的资产风控方法及设备的有益效果为:

本发明一种新媒体数据的资产风控方法,新媒体所具有的信息传递的便捷性、受众和话题的广泛都为企业形象管理、营销业务等战略带来机遇与挑战。进一步新媒体中的内容传递到利益相关者,亦会对企业产生市场压力,导致市值波动。因而,将新媒体内容与企业财务数据和市值数据进行整合,能够更为广泛地覆盖当前企业所面临的的主要外部风险来源;使用神经网络模型对市值波动是否将超出风险阈值的预测,能够有效辅助企业做出反馈;此外,本专利所设计的新媒体流量矩阵能够从源头了解企业在各类主题和创作者主体上的新媒体影响力,进而为企业后续的风险阻断工作提供针对性的分析策略。

市值波动预警装置,可以应用于新媒体数据的资产风控方法设备中,用于执行基于新媒体数据的企业市值风险监控方法中的各步骤。

一种新媒体数据的资产风控设备,可以获取企业在当前时刻对应的财务数据、市值数据和企业对应的各类新媒体数据,然后对当前时刻所对应天的市值波动范围是否超过安全范围进行预测,能够提高企业对市值风险预测的准确性和可靠性。

附图说明

下面结合附图和具体实施方法对本发明做进一步详细的说明。

图1是本发明的市值波动预警装示意图;

图2是本发明的新媒体数据的资产风控方法示意图一;

图3是本发明的新媒体数据的资产风控方法示意图二;

图4是本发明的新媒体数据的资产风控设备示意图。

图中:

电子设备10;

处理模块11;

储存模块12;

市值波动预警装置100;

获取单元110;

训练单元120。

具体实施方式

下面结合附图1至4对本发明作进一步详细说明。

一种新媒体数据的资产风控设备,基于新媒体数据的企业市值风险监控方法可以应用在上述电子设备10中,由电子设备10执行或实现方法的各步骤。

结合图2和图3方法可以包括以下步骤:

步骤S210,获取训练数据集,所述训练数据集包括多组样本数据,每组样本数据包括与多个时间序列对应的企业财务数据、市值数据及新媒体数据,所述多组样本数据中的部分组样本数据的所述数据包括上述企业数据特征及历史数据中企业市值波动范围是否处于市值波动阈值安全范围所得到的数据标签即,企业市值波动范围处于市值波动阈值安全范围,对应数据标签1,反之则为0;

步骤S220,利用所述训练数据集训练神经网络模型,得到经过训练的神经网络模型,用于预测当前时刻之后的目标时间范围对应的市值波动范围是否处于安全范围。

在上述的实施方式中,训练数据集的样本数据中,包括了基于新媒体渠道所获取的企业舆情数据,如此,可以丰富样本数据的多样性和实时性,从而有利于提高训练后的神经网络模型所预测的市值波动范围是否处于市值波动阈值安全范围的准确性和可靠性,改善因样本数据仅依据市值数据而使得神经网络模型预测的准确性和可靠性低的问题。

下面将对方法的各步骤进行详细阐述,如下:

在步骤S210中,训练数据集为在对神经网络模型进行训练前准备的数据集。训练数据集可以存储在电子设备10中,或者,训练数据集存储在其他设备中,可以供电子设备10从其他设备获取。训练数据集所包括的样本组数的数量通常较大,可以根据实际情况进行设置。

其中,在每组样本数据中,数据特征为采集网络在不同时间序列得到的企业市值数据和新媒体内容数据。数据标签可以为在不同于数据特征的时间点所对应的市值波动范围是否处于市值波动阈值安全范围,若处于这一范围,对应数据标签1,反之则为0。

其中,基于企业对应的新媒体数据构建新媒体流量矩阵,对新媒体内容去除停用词,并进行分词。按照词频对分词结果进行排序。按照分词结果对归属于企业业绩和财务分析类别的关键词总数进行计算,定义其为L1。按照分词结果对归属于高管及主要人员行动的关键词总数进行计算,定义其为L2。按照分词结果对归属于企业营销业务的关键词总数进行计算,定义其为L3。若L1、L2、L3均等于0,则该新媒体内容不属于任何类别,不划分到新媒体流量矩阵进行进一步运算。若L1高于L2与L3之和,则认定该内容属于企业业绩与财务分析类别;同理,若L2高于L1与L3之和,则认定该内容属于高管及主要人员行动类别;若L3高于L1与L2之和,则认定该内容属于企业营销业务类别。对数据采集过程中出现的新的自媒体账号,首先计算其自媒体影响力,若不符合高影响力类别,则仅将其归纳为普通自媒体;若符合高影响力类别,则将进一步判定其是否属于财经自媒体,若符合判定条件,则定义为高影响力财经自媒体,反之则定义为高影响力非财经自媒体。对新媒体流量矩阵中每个元素所对应的文本数量和文本对应的情感倾向进行计算。其中情感倾向的计算方法如下:按照新媒体流量矩阵中的内容,顺序采用采用大连理工大学依据本土化要求开发的Ekman情感本体词库与分词后的各类情感词汇进行匹配,计算每个矩阵内元素各情感类别对应的情感词汇频数。进一步将每一个矩阵内元素的各情感类别对应的情感词汇频数占对应内容的情感词汇总数的比例,取得每个矩阵内要素对应的情绪倾向。

在本实施例中,步骤S210可以包括子步骤S211至子步骤S212,如下:

子步骤S211,从以指定采集频率采集得到的企业财务、市值与新媒体内容数据集中,通过滑动窗口获取多组数据,每组数据包括采集的时间序列连续的多个值;

子步骤S212,针对每组所述企业财务、市值与新媒体内容数据,当存在市值波动范围高于设置的市值波动阈值安全范围时,对这类样本进行过采样。

在本实施例中,电子设备10可以以指定采集频率,定时采集企业的市值数据和新媒体内容数据,形成企业财务、市值与新媒体内容数据集。其中,被采集的企业数量可以根据实际情况进行确定,可以为一个或多个关联企业。

在企业财务、市值与新媒体内容数据集中,企业市值和新媒体内容数据与相应的时间序列对应,该时间序列可理解为采集到企业市值和新媒体内容数据的时间戳。然后通过滑动窗口从企业财务、市值和新媒体内容数据获取每组企业数据标签对应的历史数据。

进一步考察训练数据的样例。例如,以30天作为滑窗,天为采集频率,预测时间范围亦设定为天,即以过去30天的企业财务、市值和新媒体内容数据以及第30天的市值波动范围是够处于市值波动阈值安全范围作为数据标签;一般而言,设置年为训练数据的时间范围,滑动时间窗,获得训练数据集。

当然,在其他实时方式中,滑动窗口的长度、采集频率、预测时间范围和训练数据对应的时间范围可以根据实际情况进行设置,这里不作具体限定。

放大在市值波动范围高于设置的市值波动阈值安全范围的样本作用,对其进行过采样。例如,将过采样的比例设置为1:2,即将需要预警的样本数量放大一倍,提升模型对这类样本的描述能力,力图放宽数据不平衡的限制,提升训练结果的有效性和可靠性。

在步骤S220中,在获取到训练数据集后,可以直接利用训练数据集中的每组样本数据,对神经网络模型进行训练。其中,神经网络模型可以是但不限于深度神经网络模型、人工神经网络模型。神经网络模型可以包括输入层、循环层及全连接层,用于对每组样本数据进行学习训练,从而可以得到经过训练的神经网络模型。

在步骤S220中,在获取到训练数据集后,可以直接利用训练数据集中的每组样本数据,对长短期记忆神经网络模型进行训练。长短期记忆神经网络模型作为循环神经网络模型的变体,可以包括输入层、循环层及全连接层,用于对每组样本数据进行学习训练,从而可以得到经过训练的长短期记忆神经网络模型。

在本实施例中,步骤S220可以包括:利用所述每组样本数据中的多个所述数据特征及所述数据标签,训练所述长短期记忆神经网络模型,使得所述长短期记忆神经网络模型学习多个所述数据特征与所述数据标签的特征关系,得到所述经过训练的长短期记忆神经网络模型。企业财务数据、交易数据及新媒体流量矩阵所对应的流量及情感数据用多维特征向量

使用当前输入M

输入门

信息门控

忘记门控

输出

若z

可理解地,在训练神经网络模型时,在将每组样本数据中的多个数据特征及数据标签输入至神经网络模型后,神经网络模型中的输入层、循环层及全连接层便可以对多个数据特征及数据标签进行学习训练,从而得到每组中的多个数据特征与数据标签的特征关系,使得神经网络模型具有根据多个数据特征预测下一时间序列或其他时间点的市值波动范围是否处于安全范围的能力,如此,便可以得到经过训练的神经网络模型。

作为一种可选的实施方式,在步骤S210之后,方法还可以包括对神经网络模型进行测试优化的步骤,例如,在步骤S210之后,方法还可以包括:

根据测试样本对所述经过训练的神经网络模型进行测试,得到测试结果,所述测试样本包括多个时间序列连续的测试数据特征及测试数据标签,所述测试结果包括与所述测试数据标签的时间序列对应的市值波动范围;

根据所述测试结果中的市值波动范围是否处于安全范围与所述测试数据标签的真实水平的差值,通过所述神经网络模型中的预设损失函数,对所述神经网络模型优化,得到用于预测市值波动范围的所述神经网络模型。

可以通过调整损失函数、不同神经网络模型的实施方式,对经过训练的神经网络模型进行测试优化,有利于提高神经网络模型对流量预测的准确性和可靠性。

请参照图3,在得到经过训练的深度神经网络模型后,可以方法还可以包括利用该神经网络模型对网络的流量数据进行预测的步骤。例如,在步骤S220之后,方法还可以包括步骤S230及步骤S240,如下:

步骤S230,获取所述当前时刻之前的预设时段内对应所需的企业财务、市值和新媒体内容数据;

步骤S240,将所述企业财务、市值和新媒体内容数据输入至经过训练的所述神经网络模型,由所述神经网络模型根据所述多个时间序列对应的企业财务、市值和新媒体内容数据预测得到所述当前时刻之后的所述目标时刻的市值波动范围是否处于安全范围。

在本实施例中,当前时刻可理解为需要对未来的目标时刻进行市值波动范围预测的时刻。目标时刻为当前时刻之后的一个时刻或多个不同的时刻,可以根据实际情况进行设置。预设时段可以根据实际情况进行确定,可以为1小时、3小时、5小时等时长,这里对预设时段不作具体限定。目标时刻可以为当前时刻之后的下一时间序列,或为当前时刻之后的指定时长对应的时刻,可以根据实际情况进行确定。指定时长可以根据实际情况进行设置,这里不作具体限定。如此,有利于企业根据实际情况灵活设定目标时刻,以便于对目标时段进行预测。

如图4所示,即市值波动预警装置100,可以应用于上述的电子设备10中,用于执行方法中的各步骤。市值波动预警装置100包括至少一个可以软件或固件Firmware的形式存储于存储模块12中或固化在电子设备10操作系统Operating System,OS中的软件功能模块。处理模块11用于执行存储模块12中存储的可执行模块,例如市值波动预警装置100所包括的软件功能模块及计算机程序等。

市值波动预警装置100可以包括获取单元110及训练单元120,执行的操作内容可以如下:

获取单元110,用于获取训练数据集,所述训练数据集包括多组样本数据,每组样本数据包括与多个时间序列对应的企业财务、市值及新媒体数据,所述多组样本数据中的部分组样本数据的所述数据包括数据特征及基于市值波动范围与安全范围对比后所得到的数据标签;

训练单元120,用于利用所述训练数据集训练神经网络模型,得到经过训练的神经网络模型,用于预测当前时刻之后的目标时刻的市值波动范围数据。

可选地,获取单元110还可以用于:

从以指定采集频率采集得到的企业财务、市值及新媒体数据集中,通过滑动窗口获取多组企业财务、市值及新媒体数据集,每组数据包括采集的时间序列连续的多个值;

放大在市值波动范围高于设置的市值波动阈值安全范围的样本作用,对其进行过采样;

可选地,训练单元120还可以用于:利用所述每组样本数据中的多个所述数据特征及所述数据标签,训练所述神经网络模型,使得所述神经网络模型学习多个所述数据特征与所述数据标签的特征关系,得到所述经过训练的神经网络模型。

可选地,市值波动预警装置100还可以包括测试单元及优化单元。测试单元用于根据测试样本对所述经过训练的神经网络模型进行测试,得到测试结果,所述测试样本与训练样本相似包括多个时间序列连续的测试数据特征及测试数据标签,所述测试结果包括与所述测试数据标签的时间序列对应的流量值。优化单元用于结合所训练的企业或企业群组的特质调整损失函数等。

可选地,市值波动预警装置100还可以包括预测单元。获取单元110还可以用于获取所述当前时刻之前的预设时段内对应所需的企业财务、市值和新媒体内容数据。预测单元,用于将所述企业财务、市值及新媒体内容数据输入至经过训练的所述神经网络模型,由所述神经网络模型根据所述多个时间序列对应的企业财务、市值和新媒体内容数据预测得到所述当前时刻之后的所述目标时刻的市值波动范围是否处于安全范围。

综上所述,本申请实施例提供一种新媒体数据的资产风控方法包括:获取训练数据集,训练数据集包括多组样本数据,每组样本数据包括与多个时间序列对应的企业财务、市值和新媒体数据,多组样本数据中的部分组样本预测数据包括数据特征及基于对市值波动范围与安全范围对比得到的数据标签;利用训练数据集训练神经网络模型,得到经过训练的神经网络模型,用于预测当前时刻之后的目标时刻的数据。在本方案中,训练数据集的样本数据中亦包括与多个时间序列对应的企业财务、市值和新媒体数据,多组样本数据中的部分组样本预测数据包括数据特征及基于对市值波动范围与安全范围对比得到的数据标签。如此,可以丰富样本数据的维度,从而有利于提高训练后的神经网络模型所预测的市值范围的准确性和可靠性,改善因样本数据采集单一而使得神经网络模型预测的准确性和可靠性低的问题;需要注意的是上述实施例之间可以相互拼接使用,也可以全部结合在一起进行使用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号