首页> 中国专利> 基于完整期刊库的论文发表诚信评估分析方法及系统

基于完整期刊库的论文发表诚信评估分析方法及系统

摘要

本发明提供一种基于完整期刊库的论文发表诚信评估分析方法及系统,基于完整期刊数据总库构建了用于期刊论文的诚信评估逻辑策略,并基于诚信评估逻辑策略对已经发表的待诚信评估的期刊论文进行诚信评估,确认待诚信评估的论文载体期刊的真假、论文是否为剽窃等诚信度,实现待诚信评估期刊的作者发表论文行为的诚信度;本发明有效解决了由于真假期刊数据数量巨大,而不能有效进行论文发表的真假诚信评估问题。

著录项

  • 公开/公告号CN117421428A

    专利类型发明专利

  • 公开/公告日2024-01-19

    原文格式PDF

  • 申请/专利权人 中国人民解放军海军大连舰艇学院;

    申请/专利号CN202311430222.2

  • 发明设计人

    申请日2023-10-31

  • 分类号G06F16/383;G06F16/38;G06F16/35;G06F16/31;G06F40/194;

  • 代理机构大连至诚专利代理事务所(特殊普通合伙);

  • 代理人陈义华;王丹

  • 地址 116018 辽宁省大连市中山区解放路667号

  • 入库时间 2024-04-18 20:01:30

说明书

技术领域

本发明涉及论文发表诚信评估技术领域,尤其涉及一种基于完整期刊库的论文发表诚信评估分析方法及系统。

背景技术

学术诚信是社会发展和创新的根基,但造假、剽窃等学诚信问题长期不能杜绝,假论文大量充斥在学术评价中,人工鉴别难度大,目前国内没有专门的检测软件。

以知网、维普、万方、龙源等为代表的期刊数据公司,其产品主要功能是为使用者提供过往的文献阅读,个别具有为期刊编辑部提供来稿的复制比检测功能。学术业绩竞争激烈、非法期刊暗流涌动的环境下,在普通高校学生、中小学教师、全国医院的医务人员、企事业单位的技术人员等庞大的群体里,年发表非法期刊数据数量特别巨大,假刊、假论文的数量远远高于真刊真论文。国内专家学者以及各群体的学术管理部门、人力资源管理部门都知悉现状,但人工认定的难度大,掌握鉴定技能的人员少。基于完整期刊数据总库的条件下,亟需一种基于完整期刊库的论文发表诚信评估逻辑的制定方法,来有效解决由于期刊数据数量巨大,不能有效进行论文发表诚信的评估问题。

发明内容

本发明提供一种基于完整期刊库的论文发表诚信评估分析方法及系统,以克服上述技术问题。

一种基于完整期刊库的论文发表诚信评估分析方法,包括以下步骤:

S1:根据知网已有的期刊数据建立初始期刊数据库;并从所述初始期刊数据库中获取期刊数据的关键信息;

所述期刊数据的关键信息至少包括期刊刊名与期刊论文数据;所述期刊论文数据包括期刊论文篇名、作者姓名以及期刊论文全文;

S2:根据所述期刊数据的关键信息,将所述期刊数据中各已发表论文建立期刊文献数据集;对所述期刊文献数据集中的期刊数据进行全文遍历,并对全文遍历后的期刊数据进行文本分类,获取期刊分类数据集;

采用向量化形式对所述期刊分类数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;

并根据所述优化期刊文献数据集构建完整期刊数据总库;

S3:对待诚信评估的期刊数据进行全文遍历,并对遍历后的所述待诚信评估的期刊数据进行文本字符编码,获取待诚信评估数据;

所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;

S4:根据所述完整期刊数据总库,基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度。

进一步的,S4中所述诚信评估逻辑策略具体为:

S41:将所述待诚信评估数据传输至所述完整期刊数据总库,并基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊刊名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊刊名;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊刊名,则执行S42;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊刊名,则执行S43;

S42:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文篇名;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文篇名,则执行S44;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文篇名,则执行S43;

S43:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文数据;并判断期刊论文数据与所述完整期刊数据总库的文字复制比率;

若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制比率大于预设文字复制比率阈值,则确认待诚信评估的期刊数据的评估结果为疑似剽窃;

若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制比率小于等于预设文字复制比率阈值,则确认待诚信评估的期刊数据的评估结果为未录入所述完整期刊数据总库的非正常发表的疑似假期刊载文;

S44:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文作者;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为正常发表;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为疑似剽窃。

进一步的,S2中采用向量化形式对所述期刊文献数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;具体为

根据所述期刊文献数据集中已发表的论文进行各论文字符编码,获取编码数据向量信息;且所述编码数据向量信息至少包括期刊刊名、期刊论文篇名、期刊论文作者以及期刊论文文本;

并根据所述编码数据向量信息设置期刊文献字符链接,所述期刊文献字符链接包括对应编码数据向量信息的期刊刊名字符链接、期刊论文篇名字符链接、期刊论文作者字符链接以及期刊论文字符链接;

并根据所述编码数据向量信息与期刊文献字符链接获取优化期刊文献数据集。

一种基于完整期刊库的论文发表诚信评估分析方法的系统,包括期刊信息输入模块、期刊对比检测模块、期刊索引模块、期刊编录模块以及期刊诚信评估模块;

所述期刊索引模块用于对所述待诚信评估的期刊数据全文遍历,并将全文遍历后的所述待诚信评估的期刊数据传输至所述期刊编录模块;

所述期刊编录模块用于对全文遍历后的所述待诚信评估的期刊数据进行文本分类提取,获取待诚信评估数据,并将所述待诚信评估数据传输至所述期刊信息输入模块;

所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;

所述期刊对比检测模块用于将待诚信评估数据与期刊文献总库中的期刊数据的关键信息进行对比,并将比对结果发送至期刊诚信评估模块;

所述期刊信息输入模块用于将所述待诚信评估数据传输至所述期刊诚信评估模块;且所述期刊诚信评估模块用于调用所述期刊对比检测模块,并基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度。

进一步的,还包括可视化辅助确认模块,所述可视化辅助确认模块用于识别显示所述期刊信息输入模块输入的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息是否正确;

若确认当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息至少有一项信息识别有误,则对识别有误的信息进行人工重新输入正确信息纠错;

并将纠错后的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息传输至期刊诚信评估模块;

若确认当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息识别正确,则将当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息传输至期刊诚信评估模块。

本发明公开了一种基于完整期刊库的论文发表诚信评估分析方法及系统,基于完整期刊数据总库,并基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估的期刊的诚信度,有效解决了由于期刊数据数量巨大,不能有效进行论文发表诚信的评估问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于完整期刊库的论文发表诚信评估分析方法的流程图;

图2为本发明基于完整期刊库的论文发表诚信评估逻辑流程图;

图3为图2中不考虑期刊论文原文的诚信评估逻辑流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了实现上述目的,本发明的技术方案是:

一种基于完整期刊库的论文发表诚信评估分析方法,如图1所示,包括以下步骤:

S1:根据知网已有的期刊数据建立初始期刊数据库;并从所述初始期刊数据库中获取期刊数据的关键信息;

所述期刊数据的关键信息至少包括期刊刊名与期刊论文数据;所述期刊论文数据包括期刊论文篇名、作者姓名以及期刊论文全文;

S2:根据所述期刊数据的关键信息,将所述期刊数据中各已发表论文建立期刊文献数据集;对所述期刊文献数据集中的期刊数据进行全文遍历,并对全文遍历后的期刊数据进行文本分类,获取期刊分类数据集;

具体地,文本分类的实现方式为获取期刊数据的特征词,并基于图神经网络技术,根据期刊文献数据集中的所有待分类期刊数据的文本与对应期刊数据的特征词获取图邻接矩阵;且所述图邻接矩阵包括用于表征所述待分类期刊数据的文本节点与用于表征所述期刊数据的特征词的词节点;并将所述图邻接矩阵输入至预设的图神经网络模型,获得每个所述待分类期刊数据的图隐含向量;根据所述图隐含向量与预先获得的待分类文本的语义向量,对所述期刊文献数据集中的所有待分类期刊数据的文本进行类别预测,获得各待分类期刊数据的文本的分类结果;其中,所述语义向量是利用预训练的BERT模型对所述待分类期刊数据的文本进行编码得到。

采用向量化形式对所述期刊分类数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;

并根据所述优化期刊文献数据集构建完整期刊数据总库;

S3:对待诚信评估的期刊数据进行全文遍历,并对遍历后的所述待诚信评估的期刊数据进行文本字符编码,获取待诚信评估数据;

所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;且所述的对应的期刊论文数据即为期刊论文的正文文字数据;

具体地,所述文本字符编码的方式为通过处理器按照设定的划分方式,对待诚信评估的期刊数据中的待编码字符串进行划分,获得待编码字符序列,所述字符序列包括期刊刊名字符序列、期刊论文篇名字符序列、期刊论文作者字符序列以及对应的期刊论文字符序列;通过设定的编码器对所述待编码字符序列进行编码并存储至预设的字符编码数据集中,且所述字符编码数据集包括期刊刊名编码数据、期刊论文篇名编码数据、期刊论文作者编码数据以及对应的期刊论文编码数据;例如URI根据RFC3986标准规定,可以将URI分段编码。根据RFC3986规定,一个典型的URI结构如下,由协议、主机名、域名、默认端口号、资源路径等组成,顺序与结构均为固定。以上述URI网址https://www.jd.com为例,可依照RFC3986标准划分为“https://”、“www”、“j”、“d”和“.com”字符序列,从而便于对字符串字符序列进行编码并存储;

S4:根据所述完整期刊数据总库,基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度。

本发明基于完整期刊数据总库,构建了用于期刊论文的诚信评估逻辑策略,并基于诚信评估逻辑策略对待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度,有效解决由于期刊数据数量巨大,而不能有效进行论文发表的真假诚信评估问题。

在具体实施例中,S4中所述诚信评估逻辑策略具体为:

S41:将所述待诚信评估数据传输至所述完整期刊数据总库,并基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊刊名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊刊名;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊刊名,则执行S42;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊刊名,则执行S43;

S42:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文篇名;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文篇名,则执行S44;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文篇名,则执行S43;

S43:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文数据;并判断期刊论文数据与所述完整期刊数据总库的文字复制比率;

若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制比率于预设文字复制比率阈值,且所述预设文字复制比率阈值具体为40%,则确认待诚信评估的期刊数据的评估结果为疑似剽窃;

若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制大于预设文字复制比率阈值,则确认待诚信评估的期刊数据的评估结果为未录入所述完整期刊数据总库的非正常发表的疑似假期刊数据;即得出的结论是无该论文;

S44:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文作者;

若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为正常发表;

若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为疑似剽窃。

在具体实施例中,S2中采用向量化形式对所述期刊文献数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;具体为

根据所述期刊文献数据集中已发表的论文进行字符串编码,获取编码数据向量信息;且所述编码数据向量信息至少包括期刊刊名、期刊论文篇名、期刊论文作者以及期刊论文文本;

并根据所述编码数据向量信息设置期刊文献字符链接,所述期刊文献字符链接包括对应编码数据向量信息的期刊刊名字符链接、期刊论文篇名字符链接、期刊论文作者字符链接以及期刊论文字符链接;

并根据所述编码数据向量信息与期刊文献字符链接获取优化期刊文献数据集。

具体地,将期刊文献数据集中的各期刊文献,对采用向量形式化对已发表的论文进行字符串编码记作编码数据向量A,且所述编码数据向量A=(a,b,c,d,e,f,g,h);其中,a表示期刊文献的标题;b表示期刊文献的作者信息;c表示期刊文献的作者英文说明信息或身份证信息;d表示期刊文献的机构信息;e表示期刊文献的关键词;f表示期刊文献的摘要;g表示期刊文献的发表时间;h表示期刊文献的来源期刊;

一种基于完整期刊库的论文发表诚信评估分析方法的系统,包括期刊信息输入模块、期刊对比检测模块、期刊索引模块、期刊编录模块以及期刊诚信评估模块;

所述期刊索引模块用于对所述待诚信评估的期刊数据全文遍历,并将全文遍历后的所述待诚信评估的期刊数据传输至所述期刊编录模块;

所述期刊编录模块用于对全文遍历后的所述待诚信评估的期刊数据进行文本分类提取,获取待诚信评估数据,并将所述待诚信评估数据传输至所述期刊信息输入模块;

所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;

所述期刊对比检测模块用于将待诚信评估数据与期刊文献总库中的期刊数据的关键信息进行对比,并将比对结果发送至期刊诚信评估模块;

所述期刊信息输入模块用于将所述待诚信评估数据传输至所述期刊诚信评估模块;且所述期刊诚信评估模块用于调用所述期刊对比检测模块,并基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估的期刊的诚信度。

在具体实施例中,还包括可视化辅助确认模块,例如智能触摸显示屏;所述可视化辅助确认模块用于识别显示所述期刊信息输入模块输入的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息是否正确;

若确认当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息至少有一项信息识别有误,则对识别有误的信息进行人工重新输入正确信息纠错;

并将纠错后的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息传输至期刊诚信评估模块;

若确认当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息识别正确,则将当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息传输至期刊诚信评估模块。

具体地,如图2所示,首先通过期刊信息输入模块输入待诚信评估信息:所述待诚信评估信息包括期刊载文刊名、论文篇名、作者姓名以及期刊论文文本,并通过可视化辅助确认模块确认;

通过期刊索引模块浏览待诚信评估的完整原文(已经刊出的论文文本)并上传期刊诚信评估模块,所述期刊诚信评估模块,基于完整期刊数据总库调用期刊对比检测模块对输入的待诚信评估信息比对检测,并根据诚信评估逻辑策略输出所述完整期刊数据总库是否有该刊名、是否有该论文、是否为该作者、复制比是否大于40%的诚信评估结果。

如图3所示,为不提供期刊论文文本的诚信评估逻辑策略,即通过期刊信息输入模块输入待诚信评估信息:所述待诚信评估信息包括期刊载文刊名、论文篇名以及作者姓名,并通过可视化辅助确认模块确认;

通过期刊索引模块浏览待诚信评估的完整原文(已经刊出的论文文本)并上传期刊诚信评估模块,所述期刊诚信评估模块,基于完整期刊数据总库调用期刊对比检测模块对输入的待诚信评估信息比对检测,并根据诚信评估逻辑策略输出所述完整期刊数据总库是否有该刊名、是否有该论文以及是否为该作者的诚信评估结果。且根据基于完整期刊总库的论文发表诚信评估逻辑流程图并根据现有的编制软件,建立完整期刊论文数据库的条件下,可判别已经发表的待检测论文是否疑似为非法期刊载文或剽窃,有效解决由于期刊数据数量巨大,不能有效进行论文发表诚信的评估问题。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号