首页> 中国专利> 辅助政府投资决策的企业画像模型的构建方法

辅助政府投资决策的企业画像模型的构建方法

摘要

本发明公开了辅助政府投资决策的企业画像模型的构建方法,其包括以下步骤:构建企业标签体系、科学选取评价指标、量化企业画像模型,其中,量化企业画像模型时,首先建立评价指标与标签的关系矩阵,然后基于AHP‑CRITIC主客观赋权法计算企业画像模型的指标权重,最后将经企业标签层确定的企业评价结果与通过AHP‑CRITIC方法获得综合权重相乘得到综合得分,从而量化正面维度的和负面维度的企业画像模型。在政府投资决策领域,本发明首次将企业标签体系融合运用于企业评价体系,不仅实现了企业评价因素根据政策的变化进行周期性调整,而且可以支撑多维度企业画像,帮助政府筛选出正面优质企业或负面风险企业。

著录项

  • 公开/公告号CN114819618A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 谭翠萍;

    申请/专利号CN202210433077.2

  • 申请日2022-04-24

  • 分类号G06Q10/06;G06Q50/26;

  • 代理机构北京慧希专利代理事务所(普通合伙);

  • 代理人刘玲玲

  • 地址 101160 北京市通州区运河东大街57号院5号楼

  • 入库时间 2023-06-19 16:08:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及企业画像模型及其构建方法,具体涉及辅助政府投资决策的企业画像模型及其构建方法,属于数据处理技术领域。

背景技术

政府投资决策首先要解决的是企业评价,而现有企业评价指标体系主要从企业财务、企业效益方面进行考量,涉及企业评价的角度不够全面,企业画像是企业形象的标签化,可从多角度快速反映企业情况,用以支撑政府投资决策所需的多方面评价需求。

企业画像的宗旨是对企业情况的客观的、多方面的、数字化的反映,最终用于支撑企业评价。

企业画像构建的核心是企业标签体系的构建,企业标签的选取既要考虑现有数据的可获得性,也要能够支撑企业评价工作。企业标签体系的构建过程也是企业画像模型的构建过程。

发明内容

本发明的目的在于:通过对影响政府投资决策的各类因素进行分析,确定企业标签的选取原则,并在此基础上,通过主客观相结合的标签量化方法,构建出辅助政府投资决策的企业画像模型。

为了实现上述目标,本发明采用如下的技术方案:

辅助政府投资决策的企业画像模型的构建方法,其特征在于,包括以下步骤:

Step1、构建企业标签体系

在企业注册层面、经营层面、成果层面、信用层面、风评层面和发展层面,从现有数据中选取连续、完整并且能够支撑企业数字化形象描绘、企业筛选与企业评价的企业定量标签和定性标签,构建出企业标签体系;

Step2、科学选取评价指标

评价指标包括:正面维度评价指标、负面维度评价指标和相关因素评价指标,其中,正面维度评价指标通过LDA模型确定,负面维度评价指标通过市场监督管理、媒体和评定确定,相关因素评价指标为企业外迁倾向;

Step3、量化企业画像模型

首先,建立评价指标与标签的关系矩阵,具体如下:

设企业评价指标集矩阵为C,Ci是每个评价指标,则企业评价指标集矩阵C的表示具体如下:

C=[C

设每个评价指标C

c=[c

设某一企业的标签集矩阵为T,t

建立每个指标值c

c

则得到某一企业在某一维度上的指标值矩阵c,c的表示具体如下:

c=[max(Z

然后,基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重,具体如下:

通过AHP主观赋权法获得专家经验判断,通过CRITIC客观赋权法获得客观权重,将通过AHP方法得到的权重结果α

最后,量化正面维度的和负面维度的企业画像模型,分别如下:

(1)量化正面维度的企业画像模型

将经企业标签层确定的企业正面维度的评价结果c

其中:

c

设置正面维度的综合得分W

(2)量化负面维度的企业画像模型

将经企业标签层确定的企业负面维度的评价结果c

其中:

c

设置负面维度的综合得分W

本发明的有益之处在于:

(1)在政府投资决策领域,首次将企业标签体系融合运用于企业评价体系,不仅实现了企业评价因素根据政策的变化进行周期性调整,而且可以支撑多维度企业画像,帮助政府筛选出正面优质企业或负面风险企业;

(2)将企业画像模型分为总体目标层、中间层、评价指标层、标签层四层结构,从而将评价指标与企业标签有机融合,进而实现了企业评价指标体系的快速构建;

(3)引入了CRITIC客观赋权法,用来修正评价指标的AHP层次分析结果,解决了企业评价时由于专家打分带来的主观偏差问题;

(4)创新性地提出了基于AHP-CRITIC主客观赋权的企业画像模型的量化算法,实现了企业画像模型的量化,可以很好的支撑企业评价;

(5)按照本发明给出的方法构建出的企业画像模型有助于优质企业发现、高风险企业识别与外迁企业提早预知,从而辅助政府投资决策,促进政府数字化转型与智慧城市建设。

附图说明

图1(a)是JIEBA分词后输出主题的辨识性对比图;

图1(b)是HANLP短语切分后输出主题的辨识性对比图;

图2是主题困惑度图;

图3是主题距离图;

图4是企业画像模型的层次架构图。

具体实施方式

以下结合附图和具体实施例对本发明作具体的介绍。

政府投资重点维度的企业画像模型的构建过程,也是企业标签体系的设计、采集、处理、算法设计与实现过程。

本发明提供的辅助政府投资决策的企业画像模型的构建方法,其整体思路是:

首先,明确企业标签的选取原则与选取依据,在此基础上构建企业标签体系;

然后,基于现有政策文本,通过LDA主题聚类工具,了解政府投资对象的能力要求,明确辅助政府投资决策所需的企业评价指标;

最后,结合企业标签体系和评价指标体系,构建企业画像模型的层次架构,以企业标签来支撑企业评价,基于AHP-CRITIC主客观赋权方法,设计适合企业画像模型的量化算法,并量化企业画像模型,评出正面优质或负面风险企业。

一、构建企业标签体系

1、企业标签选取的原则

(1)标签数据可获得性

企业画像的构建首先要立足现有数据的基础上之上。政务大数据的汇聚与共享是一个长期过程,目前该项工作虽已逐步进入正轨,但个体企业数据,尤其是企业财务与研发数据始终为企业战略性核心数据,无论何时都难以充分共享。因此,企业画像一定要充分利用现有数据进行挖掘与设计。

(2)标签数据完整性

支撑某一企业标签生成的某类原始数据一定要连续、完整,不要有断档或缺项。经常会遇到企业为申报某一资金,而上报某个年度的企业财报数据,该类数据虽然很有价值,但该类财报数据从企业数量上数据覆盖不完整,从时间维度上数据不连续,因此该类年度财报数据无法支撑标签生成。

(3)标签数据功能性

企业标签不是越多越好,而是要能够支撑企业数字化形象描绘、企业筛选与企业评价等核心功能。如暂无实际应用场景,即使符合数据可获得性、数据完整性要求,也可暂不选用,以免为用户造成信息过载问题。

(4)定性与定量相结合

通过统计、规则方法从原始数据中获得的企业标签多为定量标签,是对企业基本情况的描述,但无法满足企业评价要求,因此还需要综合利用AI技术,按需生成一些企业定性标签,支撑企业画像构建。

2、企业标签选取的依据

(1)企业注册层面

根据国务院发布的《企业信息公示暂行条例》,企业需公示企业注册登记、备案信息。主要包括:企业名称、统一社会信用代码、企业注册号、企业类型、企业状态、注册地址、法定代表人、登记机关、注册资本(万元)、成立日期、核准日期、注销日期、吊销日期、经营范围、行业代码、币种、国籍等16种。

(2)企业经营层面

根据国务院发布的《企业信息公示暂行条例》,企业年度报告中的企业从业人数、资产总额、负债总额、对外提供保证担保、所有者权益合计、营业总收入、主营业务收入、利润总额、净利润、纳税总额等信息能够反映企业经营状况,但该类信息由企业选择是否向社会公示。

(3)企业成果层面

企业成果一般包括专利、标准、资质、奖励、著作权等。

(4)企业信用层面

(i)黑名单

根据国务院发布的《市场监督管理严重违法失信名单管理办法》,对于严重违法失信的企业,将在申请行政许可、资质、资格、委托承担政府采购项目、工程招投标时受到限制。

(ii)红名单

与失信黑名单相对,守信红名单为信用状况良好的诚信企业,可用于政府部门参考使用。

(iii)行政处罚信息

行政处罚是指行政机关依法对违反行政管理秩序的公民、法人或者其他组织,以减损权益或者增加义务的方式予以惩戒的行为。

(iv)经营异常名录

未按规定的期限公示年度报告或者未按照工商行政管理部门责令的期限公示有关企业信息的;或存在隐瞒真实情况、弄虚作假的企业均会纳入经营异常名录。

(5)企业风评层面

企业舆情是企业发展状态的重要风向标,尤其是大规模爆发的企业负面舆情有时会直接导致企业倒闭。

(6)企业发展层面

企业发展跟地域、政策、行业、市场等多方面因素有关,其中企业外迁,即企业区位调整的一种特殊形式,它是改变企业在市场中的位置、消费者偏好、环境规则、技术进步的重要途径。

3、构建企业标签体系

按照上面给出的企业标签选择原则及依据,本具体实施例以在北京市注册登记的企业为研究对象,归纳总结了6大类(A类、B类、C类、D类、E类、F类)25种75个企业标签,作为企业画像标签体系的备用标签,这些企业标签具体如下:

A类——企业基本信息:包括企业名称、国籍、地区、注册时间、注册状态、注册资本、法定代表人、所属行业和企业类型共计9种企业标签,其中,所属行业又包括统计口径的行业代码、工商注册口径的行业代码和是否为高精尖产业领域共计3个企业标签,企业类型又包括国有企业、民营企业和其他共计3个企业标签。

B类——企业经营:包括从业人数、主营业务、主营产品、业务活动和企业贡献共计5种企业标签,其中,主营业务又包括软件产品检测机构、重点应急企业、报废汽车回收企业、老字号餐饮、拍卖企业、口罩生产企业、防护服生产企业、防爆企业和其他共计9个企业标签,业务活动又包括高精尖专项资金支持、投资备案项目数量和其他共计3个企业标签,企业贡献又包括年税收税额、服务贡献不匹配企业和其他共计3个企业标签。

C类——企业成果:包括研发成果和企业资质共计2种企业标签,其中,研发成果又包括专利数和其他共计2个企业标签,企业资质又包括A股上市、新三板、两化融合企业、高精尖产业设计中心、中小企业公共服务平台、智能制造关键技术装备供应商、智能制造标杆、高新技术企业、绿色工厂、企业技术中心、国家级企业技术中心、北京市高精尖设计中心、国家质量标杆、专精特新“小巨人”、国家制造业创新中心、北京市产业创新中心、工业企业知识产权运用标杆、世界500强、国家级工业设计中心、国家技术创新示范企业、独角兽企业、北京市制造业单项冠军、专精特新中小企业、产业链龙头企业和其他共计25个企业标签。

D类——企业信用:包括黑名单、红名单、行政处罚数量和经营异常共计4种企业标签。

E类——企业风评:仅包括负面舆情这1种企业标签。

F类——企业发展:包括企业规模、生命周期、适宜政策和外迁情况共计4种企业标签,其中,企业规模又包括大型企业、中型企业、小型企业、微型企业、规模以上工业企业和规模以上软件和信息服务也企业共计6个企业标签,生命周期又包括初创期、成长期、成熟期和衰退期共计4个企业标签,外迁情况又包括迁往市外和外迁倾向共计2个企业标签。

二、科学选取企业评价指标

1、确定正面维度评价指标

为政策选择优质企业是政府投资决策的核心任务。企业正面维度的评价指标要围绕政府投资对象要求来选取。

虽然政府投资方向会根据实际需要进行一定调整,但对投资对象的主体要求,还是存在一定相似性。通过调查问卷不足以科学客观地总结政府投资对象要求的整体情况,本发明构建了政策实施对象要求语料库,将LDA模型与分词工具结合,研究出政府投资决策时核心的企业评价指标要求。

(1)采集数据

本具体实施例采集了2012年至2021年北京市政府相关部门面向企业发布的征集资质、项目、资金、基金类的政策文件5500件,剔除公示、通告、通告类等非申报类政策文件后为2696件,归并每年重复申报项目后,保留具有申报主体要求的政策共计320件,利用Python脚本将政策文件中申报条件按照标点符号规则分割为句子,并保留政策文件、句子之间的对应关系。

(2)抽取短语

首先尝试利用JIEBA分词,并结合停用词表进行数据规范化预处理,发现按照关键词分词后再进行LDA建模,构建的LDA模型的输出主题的辨识性不强,如图1(a)所示。

然后尝试利用HANLP进行短语提取,去掉停用词,建立WORD2ID词典,完成数据预处理,发现构建的LDA模型的输出主题的辨识性较前者强很多,如图1(b)所示。

故选用HANLP进行短语提取,去掉停用词,建立WORD2ID词典,完成数据预处理。

(3)构建LDA模型

采用词袋方法构建LDA模型。本发明将预处理后的文本数据利用Gensim封装的Doc2Bow方法创建语料库corpus,并基于此语料库不断迭代与训练LDA模型。在训练过程中发现,当迭代数Niters=200时,LDA模型达到稳定。在该参数下,当主题个数K=10时,LDA模型困惑度(perplexity)最小(如图2所示),主题距离分布合理,主题交叠最小(如图3所示),因此设定最优主题个数K=10。

(4)确定正面维度评价指标

通过LDA模型的词项分布(表1)可以看出,政府投资决策重点关注企业的行业地位、企业信用、研发条件、创新能力、成果转化能力、企业效益、团队能力、基础设施和管理水平这9个方面。

表1基于LDA主题-词项分布

基于LDA主题模型,每个政策P都会产生一个关于政策申报主体要求的主题矩阵P

P

其中,t

以政府投资决策重点关注的方面作为正面维度评价指标。

表2正面维度评价指标

2、确定负面维度评价指标

企业的负面信息主要来自市场监督管理过程中产生的行政处罚、经营异常、严重失信等信息;来自媒体的企业负面新闻信息;以及经评定投资贡献不匹配等信息。因此企业的负面维度评价指标如下:

表3负面维度评价指标

三、量化企业画像模型

企业画像模型是企业标签体系与企业评价体系的结合体,是可支撑多维度企业评价的方法体系。

企业画像模型的层次架构是实现量化算法的基础,本发明将企业画像模型分为总体目标层(Goal Layer,GL)、中间层(Middle Layer,ML)、评价指标层(Core Index Layer,CIL)和标签层(Tag Layer,TL)四层结构(如图4所示),其中:

总体目标层是最终的决策任务,即为政策推荐优质企业;

中间层是最终决策任务分解出来的子决策任务,本发明按照政府投资决策业务,将中间层设置为正面维度、负面维度、外迁维度的企业画像任务;

评价指标层为子决策任务对应的指标项集合;

标签层为可支撑各指标项计算的标签集合。

本发明提供的量化企业画像模型的方法具体包括以下步骤:

1、建立评价指标与标签的关系矩阵

企业标签不仅有定量标签,如注册资金、从业人数、税收金额等,还有很多定性标签,如企业资质等。传统企业评价方法主要基于定量指标进行的企业评价,本发明结合企业画像特点,将包含定性、定量的企业标签集做为企业评价的重要数据来源。

设企业评价指标集矩阵为C,C

C=[C

设每个评价指标C

c=[c

设某一企业的标签集矩阵为T,t

为实现指标层对标签层的数据调用,本发明设计并建立了每个指标值c

经研究发现,企业资质标签与政策文件具有很强的联系,政府会按照政策文件要求为企业评定资质,政策申报条件中会明确提出企业经营、创新、基础条件等各方面的基本要求,这些基本要求体现了获得此项资质的企业所拥有的共同能力。因此本发明创新性地将企业资质类标签与政策文本主题挖掘进行关联研究,将政策文件资质申报条件中的企业能力要求对应到该类资质企业具备的基本能力,即用政策申报要求主题矩阵P

除企业资质类标签外,其他标签与对应指标上的值结合行业标准及专家经验进行量化。

量化规则矩阵Z

c

则得到某一企业在某一维度上的指标值矩阵c,c的表示具体如下:

c=[max(Z

在本具体实施方式中,正向维度的标签和负向维度的标签与评价指标量化规则分别如下:

(1)正向维度的标签与评价指标量化规则

(2)负向维度的标签与评价指标量化规则

2、基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重本发明利用AHP-CRITIC主客观赋权法,对企业画像模型的指标权重进行计算,既采纳了专家的实际经验,又通过客观数据对指标权重进行修正。

基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重的方法具体如下:

(1)通过AHP主观赋权法获得专家经验判断

层次分析法(Analytic Hierarchy Process,AHP)是由美国T.L Satie教授提出一种主观赋权法。该方法常表现为一个包含目标、一个或多个准则和备选方案的决策树。本发明通过AHP方法对各项指标的权重进行主观赋权。

首先,通过专家打分,评估指标C

其中c

然后,使用求根法计算特征向量c

α=(α

其中:

为保证判断矩阵C

其中:

RI为平均随机一致性指标。

(2)通过CRITIC客观赋权法获得客观权重

APH层次分析法是通过专家打分的主观评价结果,指标的权重难免会带有主观偏差,本发明引入CRITIC客观赋权法,通过企业相关指标的实际数据来计算指标权重,重点关注指标的对比强度与冲突性。指标之间的对比强度越大或冲突性越强,指标的权重越大。

首先,对指标对应的原始企业数据进行同向化、归一化处理,计算出相关指标的标准差Si以及指标与指标之间的相关系数ρ

然后,计算指标中所含的信息量I

最后,计算指标的权重系数β

(3)通过AHP-CRITIC方法获得综合权重

AHP在计算指标权重时相当主观,仅依靠专家经验,不考虑实际企业数据情况。相比之下,CRITIC方法考虑实际企业数据,在计算指标权重时明显客观。本发明在保留前人研究方法优点的基础上,将通过AHP方法得到的权重结果α

3、量化企业画像模型

(1)量化正面维度的企业画像模型

将经企业标签层确定的企业正面维度的评价结果c

其中:

c

正面维度的综合得分W

(2)量化负面维度的企业画像模型

将经企业标签层确定的企业负面维度的评价结果c

其中:

c

负面维度的综合得分W

为了使上述量化正面维度和负面维度的企业画像模型的过程更加明了易懂,本具体实施例选取了工业与软件规模以上企业6968家以及申请到资金项目的企业268家(规模以上企业及申请到资金项目的企业均为政府投资的重点对象,可作为客观数据),共计7236家企业作为样本数据进行详细的说明。

(1)量化正面维度的企业画像模型

首先,利用AHP层次分析法,通过专家打分确定企业9项评价指标权重。得到的判断矩阵最大特征值为9.8613,CI值为0.1077,RI值为1.451,CR值为0.0742,CR<0.1,判断矩阵一致性验证通过,证明该结果可用。AHP法的权重计算结果如下:

然后,将这7236家企业的标签数据与正向评价指标关系降维后的矩阵c作为输入,利用CRITIC客观赋权法,计算企业9项评价指标权重。CRITIC法的权重计算结果如下:

由上表可以看出,指标权重最大值为成果转化能力(24.002%),说明企业成果数据的差异性较大;指标权重最小值为企业效益(1.879%),说明通过企业标签获得的企业效益指标数据的差异性不大。

接下来,利用AHP-CRITIC方法获得综合权重,计算结果如下:

通过上表可以看到:通过客观数据的差异性与冲突性获得的CRITIC权重可以修正通过专家打分获得的AHP权重,使得指标的权重更为合理。

正面维度的综合得分

2、构建负面维度的企业画像模型

首先,利用AHP层次分析法,通过专家打分确定企业5项评价指标权重。得到的判断矩阵最大特征值为5.1846,CI值为0.0461,RI值为1.11,CR值为0.0416,CR<0.1,判断矩阵一致性验证通过,证明该结果可用。AHP法的权重计算结果如下:

然后,利用CRITIC客观赋权法,将申请到资金项目的268家企业的标签数据与负向评价指标关系降维后的矩阵c作为输入,利用CRITIC客观赋权法,计算企业5项评价指标权重。CRITIC法的权重计算结果如下:

由上表可以看出,指标权重最大值为经营异常(31.475%),说明企业经营异常的差异性较大;指标权重最小值为负面新闻(11.099%),说明企业负面新闻数据的差异性不大。

接下来,利用AHP-CRITIC方法获得综合权重,计算结果如下:

通过上表可以看到:通过客观数据的差异性与冲突性获得的CRITIC权重可以修正通过专家打分获得的AHP权重,使得指标的权重更为合理。

负面维度的综合得分

需要说明的是,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无法对所有的实施方式予以穷举。凡是属于本发明技术方案所引伸出的显而易见变化或变动仍处于本发明的保护范围之列。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号