首页> 中国专利> 规章制度文件的处理方法及装置

规章制度文件的处理方法及装置

摘要

本发明公开了一种规章制度文件的处理方法及装置,其中,该方法包括:接收待审查的规章制度文件;对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;对待审查的规章制度条目进行关键词提取;将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,本发明能够提高规章制度文件的审查处理的效率和准确性。

著录项

  • 公开/公告号CN113077362A

    专利类型发明专利

  • 公开/公告日2021-07-06

    原文格式PDF

  • 申请/专利权人 中国建设银行股份有限公司;

    申请/专利号CN202110338385.2

  • 发明设计人 林雪能;蒋炜;刘焱军;马楠;

    申请日2021-03-30

  • 分类号G06Q50/18(20120101);G06F16/31(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F40/284(20200101);G06F40/289(20200101);

  • 代理机构11127 北京三友知识产权代理有限公司;

  • 代理人贾磊;李辉

  • 地址 100033 北京市西城区金融大街25号

  • 入库时间 2023-06-19 11:44:10

说明书

技术领域

本发明涉及数据处理技术领域,特别涉及一种规章制度文件的处理方法及装置。

背景技术

内控合规是境企业机构经营管理的头等大事,要及时和准确地掌握国家法律法规、行业政策和各类监管规定,并将这些外部规定内化为银行及员工行为依据,这是商业银行合规经营的源头和起点,银行规章制度体系庞杂,补丁文件多,存在交叉矛盾的地方,目前银行规章制度的审查处理主要通过人工比对查找相关条目,处理效率和准确性较低。

针对上述问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种规章制度文件的处理方法,用于提高规章制度文件的审查处理的效率和准确性,该方法包括:

接收待审查的规章制度文件;

对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;

对待审查的规章制度条目进行关键词提取;

将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,其中,规章制度条目库存储有多条已发布的规章制度条目;

根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

进一步的,在将提取到的关键词输入预先建立的规章制度条目库之前,还包括:

按照如下方式建立规章制度条目库;

获得OA信息系统发送和人工录入的多个已发布的规章制度文件;

对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目;

对已发布的规章制度条目进行关键词提取;

根据提取到的关键词,为已发布的规章制度条目建立数据库索引。

进一步的,还包括:

根据提取到的关键词,确定已发布的规章制度条目的类型;

根据已发布的规章制度条目的类型,对已发布的规章制度条目进行分类存储。

进一步的,对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目,包括:

根据预设的标点符号对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目。

进一步的,对已发布的规章制度条目进行关键词提取,包括:

基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值;

将多个词的tf-idf值按照从大到小的顺序排序;

根据排序结果,筛选预定数目词作为已发布的规章制度条目的关键词。

进一步的,基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值,包括:按照如下方式确定每个词的tf-idf值:

tf-idf(t,d)=tf(t,d)×idf(t);

其中,t为词,d为文档,tf(t,d)为一个词在文档中出现的次数,

进一步的,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,包括:

将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较;

根据比较结果,确定待审查的规章制度条目的处理结果;

将待审查的规章制度条目的处理结果反馈给用户。

进一步的,在查询与待审查的规章制度条目相关的已发布的规章制度条目后,还包括:

根据用户的规章制度查阅权限,对与待审查的规章制度条目相关的已发布的规章制度条目进行筛选;

根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,包括:

根据筛选后的与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

本发明实施例提供了一种规章制度文件的处理装置,用于提高规章制度文件的审查处理的效率和准确性,该装置包括:

接收模块,用于接收待审查的规章制度文件;

文本切割模块,用于对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;

关键词提取模块,用于对待审查的规章制度条目进行关键词提取;

相关条目确定模块,用于将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,其中,规章制度条目库存储有多条已发布的规章制度条目;

处理模块,用于根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

进一步的,还包括:规章制度条目库建立模块,用于:

在将提取到的关键词输入预先建立的规章制度条目库之前,按照如下方式建立规章制度条目库;

获得OA信息系统发送和人工录入的多个已发布的规章制度文件;

对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目;

对已发布的规章制度条目进行关键词提取;

根据提取到的关键词,为已发布的规章制度条目建立数据库索引。

进一步的,规章制度条目库建立模块还用于:

根据提取到的关键词,确定已发布的规章制度条目的类型;

根据已发布的规章制度条目的类型,对已发布的规章制度条目进行分类存储。

规章制度条目库建立模块进一步用于:

根据预设的标点符号对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目。

规章制度条目库建立模块进一步用于:

基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值;

将多个词的tf-idf值按照从大到小的顺序排序;

根据排序结果,筛选预定数目词作为已发布的规章制度条目的关键词。

规章制度条目库建立模块进一步用于:

按照如下方式确定每个词的tf-idf值:

tf-idf(t,d)=tf(t,d)×idf(t);

其中,t为词,d为文档,tf(t,d)为一个词在文档中出现的次数,

进一步的,处理模块具体用于:

将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较;

根据比较结果,确定待审查的规章制度条目的处理结果;

将待审查的规章制度条目的处理结果反馈给用户。

进一步的,还包括:筛选模块,用于:

在查询到与待审查的规章制度条目相关的已发布的规章制度条目后,根据用户的规章制度查阅权限,对与待审查的规章制度条目相关的已发布的规章制度条目进行筛选;

处理模块具体用于:

根据筛选后的与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述规章制度文件的处理方法。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有执行上述规章制度文件的处理方法的计算机程序。

本发明实施例通过:接收待审查的规章制度文件;对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;对待审查的规章制度条目进行关键词提取;将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,进而基于预先建立的规章制度条目库实现了相关的规章制度条目的自动查找,提高了规章制度条目审查处理的效率,通过文本切割和关键词提取能够得到反映规章制度文件要点的关键词,提高了规章制度条目审查处理的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本发明实施例中规章制度文件的处理方法流程的示意图;

图2为本发明实施例中建立规章制度条目库流程的示意图;

图3为本发明实施例中建立规章制度条目库整体框架的示意图;

图4为本发明实施例中具体实施例整体架构的示意图;

图5为本发明实施例中规章制度文件的处理装置结构的示意图;

图6为本发明实施例中规章制度文件的处理装置另一结构的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、装置、方法或计算机程序产品。因此,本发明公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

本发明实施例提供了一种规章制度文件的处理方法,用于提高规章制度文件的审查处理的效率和准确性,图1为本发明实施例中规章制度文件的处理方法流程的示意图,如图1所示,该方法包括:

步骤101:接收待审查的规章制度文件;

步骤102:对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;

步骤103:对待审查的规章制度条目进行关键词提取;

步骤104:将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,其中,规章制度条目库存储有多条已发布的规章制度条目;

步骤105:根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

如图1所示,本发明实施例通过:接收待审查的规章制度文件;对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;对待审查的规章制度条目进行关键词提取;将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,进而基于预先建立的规章制度条目库实现了相关的规章制度条目的自动查找,提高了规章制度条目审查处理的效率,通过文本切割和关键词提取能够得到反映规章制度文件要点的关键词,提高了规章制度条目审查处理的准确性。

下面首先介绍本发明实施例中建立规章制度条目库的具体过程。

图2为本发明实施例中建立规章制度条目库流程的示意图,如图2所示,在一个实施例中,在将提取到的关键词输入预先建立的规章制度条目库之前,还包括:按照如下方式建立规章制度条目库;

步骤201:获得OA信息系统发送和人工录入的多个已发布的规章制度文件;

步骤202:对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目;

步骤203:对已发布的规章制度条目进行关键词提取;

步骤204:根据提取到的关键词,为已发布的规章制度条目建立数据库索引。

在一个实施例中,步骤202中,对已发布的规章制度文件进行文本切割,包括:

根据预设的标点符号对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目。

具体实施时,图3为本发明实施例中建立规章制度条目库整体框架的示意图,如图3所示,目前银行收录的有效的总分行内规和外规8万多条,制度要点近200万条,首先,步骤201中,每天定时接收OA信息系统发送和人工录入的多个已发布的规章制度文件,步骤202中,对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目,具体的,可以根据预设的标点符号进行文本切割,文本切割规则可以包括:冒号与句号之间切割、句号与句号之间切割、句号与分号之间切割、分号与分号之间切割、冒号与分号之间切割,还可以包括其他文本切割规则,本发明不以此为限定。

在一个实施例中,步骤203中,对已发布的规章制度条目进行关键词提取,包括:

基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值;

将多个词的tf-idf值按照从大到小的顺序排序;

根据排序结果,筛选预定数目词作为已发布的规章制度条目的关键词。

在一个实施例中,按照如下方式确定每个词的tf-idf值:

tf-idf(t,d)=tf(t,d)×idf(t) (1)

其中,t为词,d为文档,tf(t,d)为一个词在文档中出现的次数,

具体实施时,步骤203中,在得到已发布的规章制度条目后,需要对条目的关键词进行提取,提取关键词时可以采用tf-idf(词频-逆文档频率)算法。tf-idf算法用以评估某个词汇对于一个文件集或一个语料库中的其中一份文件的重要程度。词汇的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。tf-idf算法是一种用于信息检索与数据挖掘的常用加权技术。如果一个词在文档中出现了很多次,但是这个词在其他文档中出现的次数很少,那么这个词对这篇文档就比较重要。在一定程度上,这个词可以表达这篇文档的关键信息。

tf-idf算法的如上述公式(1)所示,其中,t为词(term),d为文档(document),tf是词频(term frequency),idf是逆文档频率(inverse document frequency)。tf(t,d)即一个词在文档中出现的次数,比如“的”在一个文档中出现了12次,则对应的tf(t,d)=12。逆文档频率:如果只用词频,仅仅统计了文档中出现次数最多的词,这样并没有什么意义,所以要求有意义的词在该篇文档中出现的次数多,在其他文档中出现的次数少。频率的概念是频数除以总数,“逆”就是取倒数,为了防止分母为0,将其加1,最后对整体做log运算。从而有

基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值后,可以将多个词的tf-idf值按照从大到小的顺序排序,基于业务需求筛选预定数目的排序靠前的词作为已发布的规章制度条目的关键词,接着,步骤204中,根据提取到的关键词,为已发布的规章制度条目建立数据库索引。

在一个实施例中,该方法还包括:

步骤205:根据提取到的关键词,确定已发布的规章制度条目的类型;

步骤206:根据已发布的规章制度条目的类型,对已发布的规章制度条目进行分类存储。

具体实施时,还可以根据提取到的关键词,基于预设规则确定已发布的规章制度条目的类型,规章制度条目的类型可以包括遵循性条款、禁止性条款和普通条款,预设规则如下:

1、禁止性条款:按关键词判断(严禁、禁止、不得、不应);

2、遵循性条款:

a.按关键词判断(应该、应当、应、需要、需、要、必须、须);

b.阿拉伯数字开头,加文档序号的标点符号,加条款内容,例如:1、制度要求……,2.制度要求……。

通过以上步骤,可以将银行外部监管规定和银行内部的规章制度加工成一条条的遵循性条款、禁止性条款和普通条款,并进行分类存储,得到建立好的规章制度条目库,条款包含相关核心关键词标识条款核心要点,可以用于后续待审文件的关键词匹配。

下面接着介绍本发明实施例中规章制度审查的具体过程。

具体实施时,步骤101中接收业务人员上传的待审查的规章制度文件,首先进行制度正文格式转换,例如,将word或者pdf格式的正文转换成txt格式,以避免office格式文档中的表格、图片等非文本内容对正文的切割造成影响;然后,步骤102和步骤103对待审查的规章制度文件进行文本切割并进行关键词提取,文本切割和关键词提取的方式与建立规章制度条目库采用的方式一致,此处不再赘述。

在一个实施例中,在步骤104查询到与待审查的规章制度条目相关的已发布的规章制度条目后,还包括:

根据用户的规章制度查阅权限,对与待审查的规章制度条目相关的已发布的规章制度条目进行筛选;

步骤105中,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,包括:

根据筛选后的与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

在一个实施例中,步骤105中,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,包括:

将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较;

根据比较结果,确定待审查的规章制度条目的处理结果;

将待审查的规章制度条目的处理结果反馈给用户。

具体实施时,步骤104可以将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,具体查询时,在待审查的规章制度条目与任意已发布的规章制度条目有3个以上的关键词,则判定二者相关;然后根据用户岗位归属机构,确定用户的规章制度查阅权限,根据用户的规章制度查阅权限,对与待审查的规章制度条目相关的已发布的规章制度条目进行筛选,筛选出用户的规章制度查阅权限范围内的相关已发布的规章制度条目,并录入会话级别的临时表,接着,步骤105中,将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较,根据比较结果,确定待审查的规章制度条目的处理结果,若二者的关键信息一致,确定处理结果为“符合”,若二者的关键信息不一致,确定处理结果为“不符合”,并将待审查的规章制度条目的处理结果反馈给用户。在比较时,还可以将用户的规章制度查阅权限范围内的相关已发布的规章制度条目按遵循性条款和禁止性条款进行分页展示,判断是否与已审条目有冲突的内容。

下面举一个具体的例子,以便于理解本发明如何实施。

图4为本发明实施例中具体实施例整体架构的示意图,如图4所示,包括如下步骤:

第一步:接收业务需求部门经办人员上传的待审查的规章制度文件;

第二步:对待审查的规章制度文件进行文本切割并进行关键词提取,将提取到的关键词输入预先建立的规章制度条目库,输出经办人员的查阅权限范围内的与待审查的规章制度条目相关的已发布的规章制度条目,将相关的已发布的规章制度条目按照遵循性条款和禁止性条款列表展示,经办人员对相关程度进行甄别,对与待审查的规章制度条目相关的已发布的规章制度条目进行人工勾选,如条目列示不全,经办人员可以通过查询,进行补充;

第三步:接收人工勾选的已发布的规章制度条目自动生成合规性审查要点,合规性审查要点即已发布的规章制度条目中的关键词、关键控制点、监管规则核心要点等,若外规内规存在关联,在一行中显示,可能出现一个待审条目对应多个审查要点的情况。

第四步:将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较,根据比较结果,确定待审查的规章制度条目处理结果,为待审查的规章制度条目打上“符合”或“不符合”的标识,经办人员对标识为“不符合”的待审查的规章制度条目进行逐条甄别和分析,还可以对待审查的规章制度条目内容进行修改并再次判断符合性。对于未找到相关的已发布的规章制度条目的待审查的规章制度条目,可以进行人工输入比对(可手工上传合规性审查要点),无制度规定的特殊情况应进行详细解释说明。经办人员确认完成后,对待审查的规章制度条目作出初步审查结论,生成合规审查初审意见;

第五步:经办人员将合规审查初审意见提交科室负责人审核、部门主管业务负责人审批后,提交内控合规部门,内控合规部门根据内部分工转合规审查人员。

第六步:合规审查人员“待办事项”页面提示出现该审查任务,显示该送审项目的基本信息,点击“开始审查”,系统自动列示待审查的规章制度条目、外规审查要点、内规审查要点和“符合性”标签情况,合规审查人员筛选外规内规合规性审查要点,对初步审查后的待审查的规章制度条目进行二次标识,在对应的每条外规审查要点、内规审查要点后选择“符合”或“不符合”(系统默认“请选择”),选择“不符合”后,系统自动弹出“审查意见”,简要录入原因说明。“审查意见”将在审查结论中进行自动归集。

第七步:合规审查人员对整个待审查的规章制度文件作出合规审查结论(包括“同意”、“同意并附修改意见”和“不同意”),提交内控合规部门审核、审批。

审查结论为“同意”的,合规审查流程结束;审查结论为“不同意”的,退回业务需求部门经办人员,审查流程结束。审查结论为“同意并附修改意见”的,推送给业务需求部门经办人员,经办人员及时对送审项目内容切片进行修改,并填写修改说明,再次进入步骤二。

应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

基于同一发明构思,本发明实施例中还提供了一种规章制度文件的处理装置,如下面的实施例。由于规章制度文件的处理装置解决问题的原理与规章制度文件的处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

本发明实施例提供了一种规章制度文件的处理装置,用于提高规章制度文件的审查处理的效率和准确性,图5为本发明实施例中规章制度文件的处理装置结构的示意图,如图5所示,该装置包括:

接收模块01,用于接收待审查的规章制度文件;

文本切割模块02,用于对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;

关键词提取模块03,用于对待审查的规章制度条目进行关键词提取;

相关条目确定模块04,用于将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,其中,规章制度条目库存储有多条已发布的规章制度条目;

处理模块05,用于根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

图6为本发明实施例中规章制度文件的处理装置另一结构的示意图,如图6所示,在一个实施例中,该装置还包括:规章制度条目库建立模块06,用于:

在将提取到的关键词输入预先建立的规章制度条目库之前,按照如下方式建立规章制度条目库;

获得OA信息系统发送和人工录入的多个已发布的规章制度文件;

对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目;

对已发布的规章制度条目进行关键词提取;

根据提取到的关键词,为已发布的规章制度条目建立数据库索引,并将已发布的规章制度条目分类存储。

在一个实施例中,规章制度条目库建立模块06,还用于:

根据提取到的关键词,确定已发布的规章制度条目的类型;

根据已发布的规章制度条目的类型,对已发布的规章制度条目进行分类存储。

在一个实施例中,规章制度条目库建立模块06具体用于:

根据预设的标点符号对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目。

在一个实施例中,规章制度条目库建立模块06具体用于:

基于tf-idf算法求解待审查的规章制度条目中每个词的tf-idf值;

将多个词的tf-idf值按照从大到小的顺序排序;

根据排序结果,筛选预定数目词作为待审查的规章制度条目的关键词。

在一个实施例中,规章制度条目库建立模块06进一步用于:

按照如下方式确定每个词的tf-idf值:

tf-idf(t,d)=tf(t,d)×idf(t);

其中,t为词,d为文档,tf(t,d)为一个词在文档中出现的次数,

在一个实施例中,处理模块05具体用于:

将与待审查的规章制度条目相关的已发布的规章制度条目,以及待审查的规章制度条目进行比较;

根据比较结果,确定待审查的规章制度条目的处理结果;

将待审查的规章制度条目的处理结果反馈给用户。

在一个实施例中,该装置还包括:筛选模块07,用于:

在查询与待审查的规章制度条目相关的已发布的规章制度条目后,根据用户的规章制度查阅权限,对与待审查的规章制度条目相关的已发布的规章制度条目进行筛选;

处理模块05具体用于:

根据筛选后的与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。

本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述规章制度文件的处理方法。

本申请提供一种用于实现上述规章制度文件的处理方法中的全部或部分内容的计算机设备具体包含有如下内容:

处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,处理器、存储器、通信接口通过总线完成相互间的通信;通信接口用于实现相关设备之间的信息传输;该计算机设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该计算机设备可以参照实施例用于实现上述规章制度文件的处理方法的实施例及用于实现上述规章制度文件的处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有执行上述规章制度文件的处理方法的计算机程序。

综上所述,本发明实施例通过:接收待审查的规章制度文件;对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;对待审查的规章制度条目进行关键词提取;将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,进而基于预先建立的规章制度条目库实现了相关的规章制度条目的自动查找,提高了规章制度条目审查处理的效率,通过文本切割和关键词提取能够得到反映规章制度文件要点的关键词,提高了规章制度条目审查处理的准确性。

本发明实施例通过将每个已发布的行内外规章制度文件进行文本切割,采用tf-idf算法提取拆分条目里的关键词,并将条目定性为遵循性条款和禁止性条款分类存储,形成规章制度条目库,能够为待审查的规章制度文件的审查处理提供可靠的数据基础。

本发明实施例可对待审查的规章制度文件进行线上合规性审查处理,由业务需求部门经办人员提交审查材料,发起任务,对提交的审查内容进行条目的拆分确认、业务标签的建立归集,系统根据标签情况进行外规和内规的匹配和比对,经办人员对比对结果进行甄别、修正和确认,经业务需求部门审批后提交内控合规部,内控合规性审查人员对照外规和内规审查要点,核验后作出合规性审查结论,同时进行待审查的规章制度文件的查询、跟踪、统计,实现了合规审查工作的全流程管控。

虽然本发明提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

本领域技术人员应明白,本说明书的实施例可提供为方法、装置(系统)或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号