公开/公告号CN114971517A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 武汉东湖大数据交易中心股份有限公司;
申请/专利号CN202210209061.3
申请日2022-03-03
分类号G06Q10/10(2012.01);G06Q10/06(2012.01);G06F40/289(2020.01);
代理机构武汉红观专利代理事务所(普通合伙) 42247;
代理人李季
地址 430000 湖北省武汉市东湖新技术开发区高新大道999号龙山创新园一期F3栋2101室
入库时间 2023-06-19 16:36:32
法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):G06Q10/10 专利申请号:2022102090613 申请日:20220303
实质审查的生效
技术领域
本发明涉及招商引资技术领域,尤其是涉及一种产业园区招商项目线索的智能核查方法及系统。
背景技术
招商引资信息是经济区了解投资者群体动态、掌握招商引资需求与投资者投资的供求发展趋势,为投资者提供项目和服务的重要资源,没有准确、及时、有效的招商引资信息,招商引资就无法做出有效的决策。招商引资信息的数量和质量直接影响招商工作水平,如何获取招商项目线索成为了招商人的最大障碍。
传统的招商项目线索的核查方法主要是组织相关部门或专家成立招商引资项目评估委员会或工作专班,负责开展重大招商引资项目引进事前评估工作,人工核查的方法有很大的局限性和主观性,一旦核查失误或者把关不严格,会造成巨大的损失。
发明内容
有鉴于此,本申请提出了一种产业园区招商项目线索的智能核查方法及系统,用于解决传统人工核查容易带有主观性且核查过程容错率低的问题。
本发明的技术方案是这样实现的:
本发明提出了一种产业园区招商项目线索的智能核查方法,其方法包括:
S1,获取产业园区招商项目引进事前评估的主要内容和数据,得到项目线索核查的基本判断标准和标准范围;
S2,获取历史产业园区招商项目线索数据及相关指标,并进行预处理,建立历史招商项目线索数据集合以及相关指标的历史数值范围集合;
S3,建立CRF模型,基于历史招商项目线索数据集合以及历史数值范围集合对CRF模型进行训练,得到项目线索识别和判断模型;
S4,获取当前产业园区招商项目线索数据及相关指标,进行预处理后输入至项目线索识别和判断模型中进行核查,输出核查结果。
在以上技术方案的基础上,优选的,步骤S1具体包括:
所述项目线索核查的基本判断标准是根据国家法律法规以及国家产业政策来定;所述项目线索核查的标准范围由项目类型来定。
在以上技术方案的基础上,优选的,步骤S2具体包括:
对所述历史产业园区招商项目线索数据采用TF-IDF分词技术进行处理,得到历史招商项目线索数据集合;对所述相关指标采用Excel统计其区间数字,得到相关指标的数值范围集合。
在以上技术方案的基础上,优选的,对所述历史产业园区招商项目线索数据采用TF-IDF分词技术进行处理,得到历史招商项目线索数据集合具体包括:
对历史产业园区招商项目线索数据进行分词并去除停用词处理,得到数据文本,采用TF-IDF分词技术从数据文本中提取特征词;
数据文本中包含N个文档,每个文档中包含若干个词语,用d表示数据文本中的文档,t表示数据文本中的词语,所述TF-IDF的计算公式为:
W
其中,W
在以上技术方案的基础上,优选的,步骤S3具体包括:
S301,将项目线索核查的基本判断标准和标准范围作为项目线索输入序列X={x
S302,计算给定项目线索输入序列X的条件下项目线索输出序列Y的概率;
S303,基于步骤S302所得到的概率建立目标函数E,对目标函数E求解,并根据批量梯度下降法找到目标函数中的最优参数;
S304,基于最优参数重新训练CRF模型,将训练后的CRF模型作为项目线索识别和判断模型。
在以上技术方案的基础上,优选的,步骤S302具体包括:
给定项目线索输入序列X的条件下项目线索输出序列Y的概率的计算公式为:
其中,
在以上技术方案的基础上,优选的,步骤S303具体包括:
对目标函数E求解的表达式为:
其中,i=1,2,…,p,λ为特征函数权值,采用批量梯度下降法找到最优的特征函数权值。
在以上技术方案的基础上,优选的,步骤S304还包括:
将项目线索输入序列和项目线索输出序列作为训练数据,将最优参数作为CRF模型的训练参数进行训练,在训练过程中,计算CRF模型得到的条件概率和真实条件概率间的均方根误差,设置均方根误差阈值,当CRF模型得到的条件概率和真实条件概率间的均方根误差小于均方根误差阈值时,将当前训练的CRF模型作为项目线索识别和判断模型。
在以上技术方案的基础上,优选的,步骤S4具体包括:
将当前产业园区招商项目线索数据及相关指标进行预处理后输入至项目线索识别和判断模型中,得到项目线索条件概率,设置特征条件,当项目线索条件满足特征条件时核查结果取值为1,当项目线索条件不满足特征条件时核查结果取值为0,输出核查报告。
本发明还提出了一种产业园区招商项目线索的智能核查系统,所述系统包括:
标准设定模块,获取产业园区招商项目引进事前评估的主要内容和数据,得到项目线索核查的基本判断标准和标准范围;
数据处理模块,获取历史产业园区招商项目线索数据及相关指标,并进行预处理,建立历史招商项目线索数据集合以及相关指标的历史数值范围集合;
模型建立模块,建立CRF模型,基于历史招商项目线索数据集合以及历史数值范围集合对CRF模型进行训练,得到项目线索识别和判断模型;
核查模块,获取当前产业园区招商项目线索数据及相关指标,进行预处理后输入至项目线索识别和判断模型中进行核查,输出核查结果。
本发明的一种产业园区招商项目线索的智能核查方法及系统,相对于现有技术,具有以下有益效果:
(1)本发明基于CRF建立项目线索识别和判断模型,按照项目线索核查的基本判断标准和标准范围对当前产业园区招商项目线索进行智能核查,提高了产业园区招商引资工作的工作效率,相较于人工核查相比,提高了容错率。
(2)在项目线索识别和判断模型建立过程中,采用批量梯度下降法对初始CRF模型进行参数寻优,针对整个数据集进行计算,由整个数据集来确定的方向能够更好地代替样本总体,从而得到全局最优解,提高了项目线索识别和判断模型的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种产业园区招商项目线索的智能核查方法的流程示意图;
图2为本发明实施例中建立项目线索识别和判断模型的流程示意图;
图3为本发明实施例一种产业园区招商项目线索的智能核查系统的结构示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
请参照图1,本实施例提供的一种产业园区招商项目线索的智能核查方法包括以下步骤:
S1,获取产业园区招商项目引进事前评估的主要内容和数据,得到项目线索核查的基本判断标准和标准范围。
所述项目线索核查的基本判断标准是根据国家法律法规以及国家产业政策来定;所述项目线索核查的标准范围由项目类型来定。具体的,项目线索核查的基本判断标准通常主要包括以下方面:是否符合国家法律法规要求;是否符合国家产业政策、行业准入标准和产业布局;是否符合土地利用规划、城乡规划和工业园区发展规划;是否合理开发和有效利用资源,区域资源是否满足项目要求;是否符合环境保护、节能减排和生态建设要求;是否危害经济、社会和国家安全,是否对重大公共利益产生不利影响。项目线索核查的标准范围:是否为具有产业带动性项目,其中,房地产项目和政府投资项目不在认定项目之列。项目线索核查的标准范围还根据一些项目本身和投资主体因素来定,例如,项目投资规模、投资强度、投资时限、投入产出强度,主导产品的技术领域、市场竞争力及发展潜力,项目的税收贡献、带动就业能力及人力资源储备等情况;再例如,投资主体的资金实力、信用信息、经营业绩和研发创新能力等情况;投资合同中签约双方权利义务、优惠政策、违约责任等是否明确、合理等情况。
S2,获取历史产业园区招商项目线索数据及相关指标,并进行预处理,建立历史招商项目线索数据集合以及相关指标的历史数值范围集合。
需要理解的是,历史产业园区招商项目线索数据及相关指标在产业园区的招商系统中可直接获取,例如,一个招商项目线索为优质高油大豆良种繁育基地项目,其建设内容为生产繁育以及精选加工优质高油大豆种子;其建设规模为生产繁育面积4万公顷,预计种子产量8万吨,大豆种子精选加工能力7万吨;其投资估算为总投资1500万元;达到的目标为项目建成后,4万公顷优质高油大豆良种繁育基地年可生产大豆良种8万吨,加工精选国标一级大豆良种7万吨,3000平方米库房可贮存1万余吨大豆种子;5000平方米晒场可晾晒和暂存大豆种子5万余吨;其效益分析为项目建成后,可提供优质高油大豆种子7万吨,可供140万公顷耕地生产用种,140万公顷耕地可生产商品大豆280万吨,预计实现产值70亿元。
具体的,对所述历史产业园区招商项目线索数据采用TF-IDF分词技术进行处理,得到历史招商项目线索数据集合;对所述相关指标采用Excel统计其区间数字,得到相关指标的数值范围集合。
进一步的,对所述历史产业园区招商项目线索数据采用TF-IDF分词技术进行处理,得到历史招商项目线索数据集合具体包括:
对历史产业园区招商项目线索数据进行分词并去除停用词处理,得到数据文本,采用TF-IDF分词技术从数据文本中提取特征词;
数据文本中包含N个文档,每个文档中包含若干个词语,用d表示数据文本中的文档,t表示数据文本中的词语,所述TF-IDF的计算公式为:
W
其中,W
TF-IDF算法是目前使用频率最高的特征权重算法,能够对数据文本中的特征词进行有效的提取。
S3,建立CRF模型,基于历史招商项目线索数据集合以及历史数值范围集合对CRF模型进行训练,得到项目线索识别和判断模型。
请参照图2,建立项目线索识别和判断模型的具体步骤包括:
S301,将项目线索核查的基本判断标准和标准范围作为项目线索输入序列X={x
S302,计算给定项目线索输入序列X的条件下项目线索输出序列Y的概率;
具体的,给定项目线索输入序列X的条件下项目线索输出序列Y的概率的计算公式为:
其中,
S303,基于步骤S302所得到的概率建立目标函数E,对目标函数E求解,并根据批量梯度下降法找到目标函数中的最优参数;
具体的,对目标函数E求解的表达式为:
其中,i=1,2,…,p,λ为特征函数权值,采用批量梯度下降法找到最优的特征函数权值。
批量梯度下降法的具体思路是在更新每一参数时都使用所有的数据集来进行梯度的更新,由所有的数据集确定的方向能够更好的代表数据集总体,进而更准确的朝着极值所在的方向,当目标函数为凸函数时,批量梯度下降一定能够得到全局最优解。
S304,基于最优参数重新训练CRF模型,将训练后的CRF模型作为项目线索识别和判断模型。
进一步的,将项目线索输入序列和项目线索输出序列作为训练数据,将最优参数作为CRF模型的训练参数进行训练,在训练过程中,计算CRF模型得到的条件概率和真实条件概率间的均方根误差,设置均方根误差阈值,当CRF模型得到的条件概率和真实条件概率间的均方根误差小于均方根误差阈值时,将当前训练的CRF模型作为项目线索识别和判断模型。
需要理解的是,均方根误差的计算方法为现有技术,此处不再赘述。
S4,获取当前产业园区招商项目线索数据及相关指标,进行预处理后输入至项目线索识别和判断模型中进行核查,输出核查结果。
具体的,将当前产业园区招商项目线索数据及相关指标进行预处理后输入至项目线索识别和判断模型中,得到项目线索条件概率,设置特征条件,当项目线索条件满足特征条件时核查结果取值为1,当项目线索条件不满足特征条件时核查结果取值为0,输出核查报告。
需要理解的是,预处理具体包括:对当前产业园区招商项目线索数据采用TF-IDF分词技术进行处理,对相关指标采用Excel统计其区间数字。
请参照图3,本实施例提供的一种产业园区招商项目线索的智能核查系统包括标准设定模块10、数据处理模块20、模型建立模块30和核查模块40;
标准设定模块10,获取产业园区招商项目引进事前评估的主要内容和数据,得到项目线索核查的基本判断标准和标准范围;
数据处理模块20,获取历史产业园区招商项目线索数据及相关指标,并进行预处理,建立历史招商项目线索数据集合以及相关指标的历史数值范围集合;
模型建立模块30,建立CRF模型,基于历史招商项目线索数据集合以及历史数值范围集合对CRF模型进行训练,得到项目线索识别和判断模型;
核查模块40,获取当前产业园区招商项目线索数据及相关指标,进行预处理后输入至项目线索识别和判断模型中进行核查,输出核查结果。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围。
机译: (54)标题:一种扩展商务智能系统的形式和功能的基于内容的方法(57)摘要:商务智能(BI)系统具有通过以下方式将其功能扩展到项目生命周期之外的能力:具体内容。复杂的多维查询被解释为原子子表达式的树,这些原子子表达式组合成类似解析树的结构以形成整体查询。每个子树在提供适当的上下文时都是有效的。任何子树都可以是作为应用程序内容存储的表达模板,该表达模板在生成时使用带有实例特定参数的简单文本替换来生成多维表达语法。该系统包括一个复杂的类型系统和语义层,使用户摆脱了使用OLAP数据库所固有的复杂性。商业智能专家可以为每个作为内容的表达模板提供类型和语义提示。
机译: 一种便于在通信网络上访问多层媒体项目的系统。一种通过通信网络方便订户访问多层媒体项目的方法。订户在通过通信网络访问多层媒体项目中的应用。通信网络。远程销售系统,用于方便访问Internet上的多层媒体项目; remistura设备,用于生成多层媒体项目的混音。系统,用于方便访问源自便携式存储设备的多层媒体项目。相对于媒体文件和系统层驱动商业活动的方法,以利于使用点对点连接访问多层媒体项
机译: 用于训练智能烹饪设备,在智能烹饪设备中定位食物项目以及确定智能烹饪设备中食物项目的烹饪进度的采集和标注烹饪图像的系统和方法