首页> 中国专利> 通过自然语义分析实现智能匹配推荐的系统及方法

通过自然语义分析实现智能匹配推荐的系统及方法

摘要

本发明提供了一种通过自然语义分析实现智能匹配推荐的系统及方法,包括:自然语义处理模块:接收来自政务网的企业信息、政策信息和企业服务业务办理信息,根据自然语言处理方法进行信息数据抽取和处理;企业画像生成模块:通过抽取的信息数据,分析得到企业对应画像和画像标签;政策分析模块:通过抽取出的信息数据,进行政策的适用范围和评价标准的拆解;推荐模块:根据画像标签、政策范围和评价标准,对企业和对应政策进行匹配和推荐。本发明将企业和政策进行匹配,实现了企业画像与政务事项的智能匹配和推荐,为企业提供更多机会和咨询,促进企业发展。

著录项

说明书

技术领域

本发明涉及自然语义分析技术领域,具体地,涉及一种通过自然语义分析实现智能匹配推荐的系统及方法。

背景技术

智慧政务作为智慧城市建设中重要的一环,近年来已经逐渐成为一个发展热点。它能提高政府办事效率、缩短居民办事流程,给居民的城市生活带来更好的体验。尤其在智慧政务中的企业服务,智能且高效的服务不仅能方便企业办事人个人的工作,更能促进企业的快速发展,为城市添加更多的活力。

智慧化企业服务带来许多便利和机遇的同时,也是个具有极大挑战性的课题。企业事务和涉及的政策非常多样,更因为不同企业不同的行业、规模、发展状况等衍生出的众多场景,导致企业很难完全掌握自己适用的政策和需要办理的事项。一方面政府需要从被动的协助企业办事转化为主动的向企业推送适用事项,一方面企业需要更多政府扶持和指导,在此背景下,亟需一个能进行智能匹配推荐的企业服务系统来作为桥梁,优化双方效率。本专利正是提供一种通过自然语义分析实现的智能匹配推荐,用以根据企业自身情况个性化推荐企业适用的扶持政策和需要办理事项等,实现企业服务的“千企千面”。

专利文献CN110032637A(申请号:201910302296.5)公开了一种基于自然语义分析技术的简历智能推荐算法,主要是通过自然语义分析来筛选简历,并不适用于企业政务办理,无法适应企业和相关政府部分的需求;

专利文献CN106383876A(申请号:201610815076.9)公开了一种智能化的项目匹配系统,虽然也进行了政策的推送,但是政策本身是通过爬虫获取,有错漏可能,并且需要企业手动填写信息。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种通过自然语义分析实现智能匹配推荐的系统及方法。

根据本发明提供的通过自然语义分析实现智能匹配推荐的系统,包括:

自然语义处理模块:接收来自政务网的企业信息、政策信息和企业服务业务办理信息,根据自然语言处理方法进行信息数据抽取和处理;

企业画像生成模块:通过抽取的信息数据,分析得到企业对应画像和画像标签;

政策分析模块:通过抽取出的信息数据,进行政策的适用范围和评价标准的拆解;

推荐模块:根据画像标签、政策范围和评价标准,对企业和对应政策进行匹配和推荐。

优选的,所述企业画像生成模块包括:

逻辑分析模块:根据预设规则,对提取的信息数据进行规则逻辑判断,得到画像标签;

企业画像管理模块:生成企业画像,并通过画像标签进行权重分析和标记,在应用中进行最优控制。

优选的,所述政策分析模块包括:

条件抽取模块:对政策适用的范围进行分析和必要条件的筛选;

评价抽取模块:对政策评价方式进行分析,进行充分条件和控制条件的筛选。

优选的,所述推荐模块包括:

匹配推荐模块:通过政策的适用条件范围筛选以及评价评估,推荐企业匹配的政策和事项;

同类推荐模块:对企业画像进行聚类分析,得到类似企业,根据类似企业的办理事项,进行部分条件筛选,推荐类似企业感兴趣的事项和政策;

行为推荐模块:通过用户的行为分析和事项关联,围绕企业兴趣点进行推荐;

推荐输出模块:对推荐内容进行整理和输出,生成推荐理由,并对推荐系统进行评价和改进。

根据本发明提供的通过自然语义分析实现智能匹配推荐的方法,包括:

步骤1:建立自然语义处理模型和逻辑规则;

步骤2:根据自然语义处理模型,对政务网数据进行分析,包括企业信息、业务办理信息和政策信息;

步骤3:生成企业画像;

步骤4:对政策进行分析;

步骤5:进行匹配推荐分析;

步骤6:进行同类推荐分析;

步骤7:进行用户行为分析;

步骤8:根据推荐效果进行排序并给出推荐理由;

步骤9:对推荐系统和推荐算法进行评价。

优选的,所述步骤1包括:

步骤1.1:建立语料库,包括企业画像各个维度的语料库、政府政策语料库和政务企业服务事项语料库;

步骤1.2:进行语料清洗,包括实体提取、逻辑规则提取、正则匹配、去重和标注;

步骤1.3:根据语义处理模型,将字序列切分为符合人类语义理解的词汇,采用CRF算法结合词典进行分词;

步骤1.4:进行词性标注,系统采用隐马尔可夫模型,区分不同词性;

步骤1.5:基于独热码,将词转化为稠密向量,以作为自然语义处理模型的特征;

步骤1.6:采用RNN模型训练自然语义处理模型;

步骤1.7:基于企业信息和政策信息规定逻辑分析规则,包括行业分析规则;

步骤1.8:基于企业信息和政策信息制定规则生成框架;

步骤1.9:基于随机森林算法对企业的统计数据进行分类;

步骤1.10:结合三西格玛准则得到数据的理论分布,并依据理论分布辅助进行企业画像分类规则的生成。

优选的,所述步骤3包括:

步骤3.1:从行业维度、企业规模维度、企业发展阶段维度、业务维度、舆情维度、知识产权维度、业务办理历史维度这七个不同维度进行分析,抽取企业关键词;

步骤3.2:依据关键词的来源、关联权重、关联频次对画像标签进行筛选和排序;

所述步骤4包括:

步骤4.1:建立事项与政策、事项与事项、政策与政策之间的关联;

步骤4.2:对每个事项,根据相关事项和政策,获取其适用范围的必要条件和评价标准;

所述步骤5包括:

步骤5.1:将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;

步骤5.2:将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;

步骤5.3:将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;

所述步骤6包括:

步骤6.1:将企业画像进行聚类分析,得到企业的类似企业;

步骤6.2:筛选出类似企业办理的事项,作为当前企业的推荐。

优选的,所述步骤7包括:

步骤7.1:分析用户行为,包括查看事项、询问问题、点击事项频次和停留时间,通过不同行为加权平均得到用户的感兴趣事项;

步骤7.2:根据政策与事项的关联性,推荐用户感兴趣的事项。

优选的,所述步骤8包括:

步骤8.1:对推荐事项进行加权融合与排序,使与用户关联程度更高的推荐事项进行更靠前显示;

步骤8.2:根据推荐事项的生成来源,将推荐事项打上推荐理由标签。

优选的,所述步骤9包括:

步骤9.1:根据准确率、召回率和F1值,对推荐事项进行正确性评价;

步骤9.2:根据平均准确率和归一化折扣增益值,对推荐事项排序进行评价。

与现有技术相比,本发明具有如下的有益效果:

1、本发明利用自然语义处理技术,从七个维度出发对企业的整体情况进行分析,形成了全面的企业画像;梳理政府政策和企业办事事项,抽取事项的必要性、适用范围、评价标准等,将需要人工阅读和处理的文本内容转化为可以进行智能匹配和计算的量化指标;

2、本发明通过计算企业和政策的匹配,实现了企业画像与政务事项的智能匹配和推荐,为企业提供更多机会和咨询,促进企业发展;

3、本发明通过企业画像的聚类分析,计算类似企业,并针对同类企业推送诸如行业新闻、行业活动、同类企业办理事务、最新政策等,增加企业竞争力,使企业不落于人后。

4、本发明通过对企业用户行为的分析,推送企业可能需要关注的事项,辅助企业办理所需事务;对推荐列表智能排序,并配有解释系统,让企业得到最合适的推荐,除此之外,推荐系统还能通过企业反馈评价进行反复改进,使系统越来越适应实际情况。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为系统模块关系示意图;

图2为系统方法流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1:

如图1,根据本发明提供的通过自然语义分析实现智能匹配推荐的系统,包括:

自然语义处理模块,接收来自政务网的企业信息、政策信息、企业服务业务办理信息等,利用自然语义处理来进行信息的抽取和处理,便于进行后续分析。

企业画像生成模块,通过抽取的数据,分析得到企业对应画像标签;

政策分析模块,利用抽取出的数据,进行政策条件范围和评价标准的拆解;

推荐模块,结合以上模块的输出,通过智能的分析,实现对企业和政策的匹配推荐。

所述企业画像生成模块包括:

逻辑分析模块,用于根据已有规则,提取的信息进行规则逻辑判断以得到画像标签。

企业画像管理模块,进行企业画像的生成,并对生成的画像标签进行权重分析和标记,从而在应用中达到最优效果。

所述政策分析模块包括:

条件抽取模块,对政策适用的范围进行分析,即进行必要条件的筛选。

评价抽取模块,对政策评价方式进行分析,即进行充分条件和加分条件的筛选。

所述推荐模块包括:

匹配推荐模块,基于内容的推荐模块,通过政策的适用条件范围筛选以及评价评估,来推荐企业匹配的政策和事项,包含子模块:条件筛选模块、智能评分模块。

同类推荐模块,基于用户的推荐,通过企业画像的聚类分析,得到类似企业,根据类似企业的办理事项,辅以部分条件筛选,来得到企业可能感兴趣的事项和政策,包含子模块:聚类分析模块、推荐筛选模块。

行为推荐模块,基于隐式用户反馈的推荐模块,通过用户的行为分析,以及事项关联等,围绕企业兴趣点展开推荐,包含子模块:行为分析模块、行为关联模块。

推荐输出模块,对推荐进行整理和输出,主要包括对其他模块推荐的内容进行排序,生成推荐理由,并对推荐系统进行评价,以便进行系统改进,其中包含以下子模块:推荐排序模块、推荐理由模块、推荐评价模块。

如图2,根据本发明提供的通过自然语义分析实现智能匹配推荐的方法,包括:

步骤1:进行预处理,具体是自然语义处理模型的建立和逻辑规则的建立;

步骤2:利用步骤1建立部署的模型对政务网数据进行分析,包括企业信息、业务办理信息、政策信息等;

步骤3:生成企业画像;

步骤4:对政策进行具体分析;

步骤5:进行匹配推荐分析;

步骤6:进行同类推荐分析;

步骤7:进行用户行为分析;

步骤8:对推荐进行排序和解释;

步骤9:推送推荐,进行对系统和算法的评价。

所述步骤1包括:

步骤1.1:自然语义处理模型的建立;

步骤1.2:企业画像判定逻辑规则的建立;

所述步骤1.1包括:

步骤1.1.1:建立语料库,包括但不限于企业画像各个维度的语料库(企业行业、规模、发展、知识产权、业务范围等七个维度)、政府政策语料库、政务企业服务事项语料库等。

步骤1.1.2:进行语料清洗,包括实体提取、逻辑规则提取、正则匹配、部分人工操作(如去重、标注等)等;

步骤1.1.3:分词,即根据语义模型,将字序列切分为符合人类语义理解的词汇,系统采用CRF算法结合词典进行分词。

步骤1.1.4:进行词性标注(Part-of-Speech tagging或POS tagging),系统采用隐马尔可夫模型(HMM),区分不同词性如名词、动词、形容词等。

步骤1.1.5:特征工程,基于One-hot,将词转化为稠密向量,以作为深度学习模型的特征。

步骤1.1.6:训练模型,受限于数据规模,系统采用比较传统的RNN模型。

所述步骤1.2包括:

步骤1.2.1:基于企业相关理论和学习以及国家政策直接规定部分逻辑分析规则,如行业分析规则等。

步骤1.2.2:基于企业相关理论和学习和国家政策制定部分规则生成的框架,为后续步骤提供理论基础;

步骤1.2.3:基于随机森林等方法对企业的统计数据进行分类。

步骤1.2.4:结合三西格玛准则得到的数据的理论分布,并依据理论分布来辅助进行部分企业画像分类规则生成。

所述步骤3包括:

步骤3.1:从行业维度、企业规模维度、企业发展阶段维度、业务维度、舆情维度、知识产权维度、业务办理历史维度等七个不同维度进行分析,抽取企业相关关键词;

步骤3.2:依据关键词的来源、关联权重、关联频次等对画像关键词进行筛选和排序。

所述步骤4包括:

步骤4.1:建立事项与政策、事项与事项、政策与政策之间的关联;

步骤4.2:对每个事项,根据相关事项和政策,抽取其适用范围(必要条件);

步骤4.3:对每个事项,根据相关事项和政策,抽取其评价标准(加分项、评分权重等);

步骤4.4:对每个事项,根据相关事项和政策,抽取其奖励(若有)或其必要性(若有);

所述步骤5包括:

步骤5.1:将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;

步骤5.2:将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;

步骤5.3:将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;

所述步骤6包括:

步骤6.1:将企业画像进行聚类分析,从而得到企业的类似企业;

步骤6.2:筛选出类似企业办理的事项,作为当前企业的推荐;

所述步骤7包括:

步骤7.1:分析用户行为,如查看了哪些事项、询问了哪些问题、点击事项频次和停留时间等,通过不同行为加权平均得到用户的感兴趣事项;

步骤7.2:依据政策与事项分析中得到的关联关系,推荐用户可能感兴趣或需要的其他事项;

所述步骤8包括:

步骤8.1:对各模块产出的推荐进行加权融合与排序,使与用户关联程度更高的推荐更靠前显示;

步骤8.2:根据推荐的生成来源,将推荐打上推荐理由标签,如:通过步骤5.3得到的推荐将被标记为“可能需要完成的事项”,同时通过步骤5.1、5.2得到并且抽取奖励价值高的事项将被标记为“成功率高的事项”和“扶持奖励事项”;

所述步骤9包括:

步骤9.1:对于推荐集合的正确性评价,系统采用准确率(Precision)、召回率(Recall)、F1值(F1-Measure)。精确率计算的是预测结果中多少是正确的正结果预测,它体现的是模型区分负样本的能力;召回率计算的是样本中有多少的正结果被预测正确了,是体现模型对正样本的识别能力;F1值则是两者的综合,体现模型的稳健性。由于推荐栏位固定,系统适用Precision@n(P@n)、Recall@n(R@n)、F1@n来进行度量。

步骤9.2:对于推荐事项排序的评价,系统采用平均准确率(MAP)和归一化折扣增益值(Normalized Discounted Cumulative Gain,NDCG)来进行。

实施例2:

针对政策匹配的推荐:

对于A公司,系统将首先根据A公司信息,通过自然语义处理得到A的企业画像。企业画像为一些含有权重的标签,例如“研究和试验发展”(行业)、“人工智能产品”(经营范围)、“智能制造执行系统软件”(软著标签)、“2009-05-05”(注册时间)等。

而对于政策和事项,系统会分析出政策和事项关联,并给出事项的必要性、适用范围、评价标准。例如对于高新技术企业认定事项,将关联“高新技术企业认定管理办法”、“高新技术企业认定管理工作指引”等政策,“技术合同认定登记”等事项。系统分析该事项为“对于所有企业”的“非必要”事项,适用范围要求包括但不限于:“企业申请认定时须工商注册满一年以上”、“主要产品属于电子信息技术(包括计算机辅助工程管理软件)、生物与新医药技术、航空航天技术等领域(《国家重点支持的高新技术领域》内定义的领域)”等,评价标准包括但不限于企业创新能力评价等。抽取事项的奖励为“享受税收优惠政策”等。

分别进行分析后,系统将为企业与事项进行匹配计算。事项匹配计算发现公司符合高新技术评定要求(注册时间满一年以上,产品属于电子信息技术内的计算机辅助工程管理软件等)。事项成功率计算得出,企业知识产权、研究开发组织管理水平得分很高,科技成果转化能力一般,综合评定为一个成功率较高的事项。必要性分析为事项属于非必要事项。

综上,系统分析后推送高新技术企业认定事项给用户,并将解释为“成功率较高”、“奖励事项”。

本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号