首页> 中国专利> 一种基于Apriori算法的政务服务办件分析方法

一种基于Apriori算法的政务服务办件分析方法

摘要

本发明公开了一种基于Apriori算法的政务服务办件分析方法,涉及电子政务领域,包括步骤:对每一条办件数据,抽取申请人类型、申请人名称、证件类型、证件号码、办件名称、申请时间合并作为一个办件数据项;筛选m天内申请人类型、申请人名称、证件类型、证件号码均一致的办件数据项,并将这些数据项中的办件名称放入同一个办件名称集合;将所有所述办件名称集合作为元素纳入总办件集合;对总办件集合进行Apriori运算,产生候选项集并留取频繁项集;对频繁项集内的元素间的任一关联规则进行置信度计算,并置信度高的关联规则,形成关联办件。本发明将法人和自然人进行区分,并利用时间窗口,提高了关联办件获取的效率和准确度。

著录项

  • 公开/公告号CN116452390A

    专利类型发明专利

  • 公开/公告日2023-07-18

    原文格式PDF

  • 申请/专利权人 苏州新建元数字科技有限公司;

    申请/专利号CN202310295941.1

  • 发明设计人 吴文昊;金家梁;闾扬;

    申请日2023-03-24

  • 分类号G06Q50/26(2012.01);G06F18/26(2023.01);G06N5/025(2023.01);

  • 代理机构苏州谨和知识产权代理事务所(特殊普通合伙) 32295;

  • 代理人叶栋

  • 地址 215000 江苏省苏州市工业园区东长路88号N1幢1001室和1002室

  • 入库时间 2024-01-17 01:16:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-04

    实质审查的生效 IPC(主分类):G06Q50/26 专利申请号:2023102959411 申请日:20230324

    实质审查的生效

  • 2023-07-18

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及电子政务领域,更具体地说,涉及一种基于Apriori算法的政务服务办件分析方法。

背景技术

随着“互联网+政务服务”等工作的深入推进,各级政府网站信息内容的快速增加与用户个性化需求之间的矛盾日益凸显。面对日益增多的办事服务,单纯依靠简化优化网站结构、细分服务栏目来降低信息查找难度的做法难以为继。

目前现有解决上述问题的方法如下:

一种基于关联规则算法的政务服务事项推荐方法(CN112241420A):从政务服务的办件库读取办件数据,获取办件申请人的身份标识及所办事项的事项编码,合并具有相同身份标识的事项编码,组成事项集合,利用关联规则算法计算事项频繁项集及频繁项集支持度,通过频繁项集支持度筛选获得适合的事项频繁项集,利用筛选获得的事项频繁项集确定适合的关联规则,利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。

上述技术的缺陷主要体现在三个方面:

1、事项集合仅包含申请人的身份标识及所办事项的事项编码,对于自然人办件不造成影响,但是对于法人办件来说,由于存在委托中介机构办理和部分法人代表同时拥有多家企业的情况,因此其事项集合中的事项之间,如果对事项内容提取不准确,就容易相互干扰,影响最终的服务事项的推荐结果;

2、事项集合中对于不同事项的办理间隔未有明确的约束,导致最终的计算结果,体现的多是一些高频的政务服务事项,而无法充分体现政务服务事项之间的关联关系;

3、在最终的关联规则结果判定中,没有对关联关系产生的结果进行验证,容易导致产生错误的关联规则。

发明内容

本发明要解决的技术问题是提供一种基于Apriori算法的政务服务办件分析方法,以解决背景技术中提到的问题。

为了达到上述目的,本发明采取以下技术方案:

一种基于Apriori算法的政务服务办件分析方法,包括如下步骤:

S1:从政务服务的办件库获取办件数据;

S2:对每一条办件数据,抽取申请人类型、申请人名称、证件类型、证件号码、办件名称、申请时间6类字段合并作为一个办件数据项;

S3:设置时间窗口m;

S4:筛选m天内申请人类型、申请人名称、证件类型、证件号码均一致的办件数据项,并将这些数据项中的办件名称放入同一个办件名称集合D

S5:将所有所述办件名称集合D

S6:对总办件集合H进行Apriori运算,产生候选项集;

S7:依据办件名称集合Di,判断每个候选项集中元素支持度是否都大于预先定义的最小支持度阈值,若大于,则保留该项集作为频繁项集;否则对该项集予以丢弃;

S8:对频繁项集内的元素间的任一关联规则进行置信度计算,并判断置信度是否大于预设的最小置信度,若大于,则保留该关联规则,否则丢弃该关联规则;

S9:对S8保留的关联规则进行提升度计算,并判断提升度是否大于预设的最小提升度,若大于,则保留该关联规则,否则丢弃该关联规则;

S10:对所有保留的关联规则进行归纳总结,形成关联办件,并对用户进行办件推荐。

优选的,所述时间窗口m设置为60天。

所述申请人类型包括自然人和法人。

所述证件类型包括身份证号码和统一社会信用代码。

优选的,在S4筛选过程中,按照申请人类型、申请人名称、证件类型、证件号码的顺序进行依次分类筛选。也就是说,先筛选出申请人类型相同的办件数据项,然后再从这些办件数据项筛选出申请人名称相同的项,依次类推。

本发明相对于现有技术的优点在于:

在对办件数据的预处理过程中,由于法人办件存在以下特点:

1)多家法人(包括企业)拥有同一个法人代表;

2)相当数量的法人办件,以委托的形式由中介机构开展办理,办件由中介机构员工代办;

本发明针对法人,所提取的是法人的“申请人类型、申请人名称、证件类型、证件号码”,而不是法人代表的姓名或者代办机构、员工的姓名等。因此可将最终的办件主体定位到法人的统一社会信用代码,从而避免采集法人代表或者代办机构、员工的信息,以免对后续数据分析处理带来的不良影响。而采取“申请人类型、申请人名称、证件类型、证件号码”定位,而非直接利用身份证号码或者统一社会信用代码定位,可以增加定位的准确度,避免单纯的号码比对容易产生出现的错误;且可以设置按顺序下述顺序:“申请人类型、申请人名称、证件类型、证件号码”进行依次比对,从而一层层进行筛选,这种递进式筛选方式,可以使得筛选过程一层比一层精简,从而避免所有数据进行两两比对过程的繁琐。

本发明基于政务服务事项的办理时间,提取其中的申请时间信息,通过时间窗口的引入,减少关联规则产生过程中的多余组合,准确判断事项办理的前后道关系;如果不设置时间窗口,那分析后的一些办件可能因为办件本身的高频,而导致实际上没有前后道关系;例如很多人都办理过身份证和驾照,而身份证和驾照的办理并无逻辑上的关系,所以如果不设置具体的时间窗口,会导致身份证与驾照之间可能产生关联关系,这样的高频办件对最终结果容易产生干扰,而本发明通过采用时间窗口避免了这一干扰。

在最终的关联规则判定上,还可通过提升度的计算,来对置信度高的关联规则开展验证,进一步避免高频事项对关联规则结果造成的影响。

附图说明

图1是本发明方法的大致流程图。

具体实施方式

下面结合附图对本发明的具体实施方式作描述。

当前我们在做的实际项目中,对于政务服务事项的推荐效果欠佳,无法按照领导期望完成相关服务事项的推荐,无法实现政务服务从“人找政策”向“政策找人”来转变。

基于此,我们希望通过关联规则的算法,来分析事项办理之间的关系,例如A办理完建筑工程规划许可证后,通常会办理建设工程施工许可证,那我们通过算法得到关联关系后,就可以对办理过建筑工程规划许可证的用户,主动推送建设工程施工许可证的办理指南和相关政策。

如图1所示,本发明一种基于Apriori算法的政务服务办件分析方法,包括如下步骤:

S1:从政务服务的办件库获取办件数据;

S2:对每一条办件数据,抽取申请人类型、申请人名称、证件类型、证件号码、办件名称、申请时间6类字段合并作为一个办件数据项;

S3:设置时间窗口m;

S4:筛选m天内申请人类型、申请人名称、证件类型、证件号码均一致的办件数据项,并将这些数据项中的办件名称放入同一个办件名称集合Di,其中i标注一致的申请人类型、申请人名称、证件类型、证件号码;

S5:将所有办件名称集合Di作为元素纳入总办件集合H={D1,D2,D3……};

S6:对总办件集合H进行Apriori运算,产生候选项集;

S7:依据办件名称集合Di,判断每个候选项集中元素支持度是否都大于预先定义的最小支持度阈值,若大于,则保留该项集作为频繁项集;否则对该项集予以丢弃;

S8:对频繁项集内的元素间的任一关联规则进行置信度计算,并判断置信度是否大于预设的最小置信度,若大于,则保留该关联规则,否则丢弃该关联规则;

S9:对S8保留的关联规则进行提升度计算,并判断提升度是否大于预设的最小提升度,若大于,则保留该关联规则,否则丢弃该关联规则;

S10:对所有保留的关联规则进行归纳总结,形成关联办件,并对用户进行办件推荐。

时间窗口m可以设置为60天。

申请人类型包括自然人和法人,且应该区分开。证件类型包括身份证号码和统一社会信用代码,且应该区分开。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号