首页> 中国专利> 用于科技要素检索的智能排序方法、电子设备和存储介质

用于科技要素检索的智能排序方法、电子设备和存储介质

摘要

本申请的涉及一种用于科技要素检索的智能排序方法,包括:根据检索关键词确定所述检索关键词的权值向量;根据所述权值向量确定权值;根据所述权值,对数据库内的数据进行排序。

著录项

  • 公开/公告号CN113127761A

    专利类型发明专利

  • 公开/公告日2021-07-16

    原文格式PDF

  • 申请/专利权人 中国科学技术信息研究所;

    申请/专利号CN201911416171.1

  • 申请日2019-12-31

  • 分类号G06F16/9538(20190101);G06N3/04(20060101);

  • 代理机构11446 北京律和信知识产权代理事务所(普通合伙);

  • 代理人姚志远;苏捷

  • 地址 100038 北京市海淀区复兴路15号

  • 入库时间 2023-06-19 11:52:33

说明书

技术领域

本申请属于数据检索领域,特别涉及一种科技要素检索的智能排序方法、一种电子设备和一种存储介质。

背景技术

科技要素检索不同于面向公众的搜索引擎提供的检索服务,主要有以下3个特点:专业性强:检索关键字的组合不当会导致检索不出结果或检索结果偏离,需要做专业性的模糊检索处理。重复性强:某一领域内的相关研究可以通过一组关键字进行描述,而用户一般使用此组关键字的子集进行检索,一定时间内服务器响应此领域的检索需求有很强的时间相关性,长时间内可以设置为研究热点,短时间内可以设置为用户感兴趣的研究方向。关联性强:公众数据检索的相关性一般属于弱相关关系,而科技检索属于强相关性。并且科技文献的互相引用可以支撑建立关键词关联性的动态数据集合。

发明内容

本申请旨在提供一种科技要素检索的智能排序方法、一种电子设备和一种存储介质。

本申请的一个实施例提供了一种用于科技要素检索的智能排序方法,包括:根据检索关键词确定所述检索关键词的权值向量;根据所述权值向量确定权值;根据所述权值,对数据库内的数据进行排序。

可选地,其中所述权值向量可以包括:专业性权值向量、重复性权值向量和关联性权值向量中的至少一种。

可选地,其中所述根据所述权值向量确定权值可以包括:根据所述权值向量和关联向量确定权值,其中所述关联向量包括:专业性重复性权值向量和重复性关联性权值向量中的至少一种。

可选地,其中所述根据所述权值向量确定权值可以包括:O=W

可选地,其中所述根据所述权值向量确定权值,之后还可以包括:判断所述权值是否收敛。

可选地,其中所述判断所述权值是否收敛之后还可以包括:如果否,则根据所述权值修正所述权值向量;和再次执行所述根据所述权值向量确定权值。

可选地,其中所述根据所述权值,对数据库内的数据进行排序可以包括:按照所述排序输出所述数据库中的数据。

进一步地,其中所述按照所述排序输出所述数据库中的数据可以包括:按照所述排序输出所述数据库中排序靠前的预设数量的数据。

本申请的另一实施例提供了一种电子设备,包括处理器和存储器,以及存储于所述存储器的所述处理器可执行的程序,当所述程序被执行时,所述处理器执行前述至少一种方法。

本申请的另一实施例提供了一种存储介质,存储处理器可执行的程序,当所述程序被执行时,所述处理器执行前述至少一种的方法。

利用上述方法、电子设备和存储介质,提出基于人工神经网络的科技要素检索的智能排序算法,以满足科技要素检索专业性,重复性和关联性的需求。改进了传统神经网络的感知层权重结构,增加了检索专业性,重复性和关联性权重,对用户输入的检索关键字进行感知,通过三层权重网络,输出搜索结果,进而对搜索结果进行排序。可以使得数据检索更准确。

附图说明

图1示出了本申请的一个实施例科技要素检索的智能排序方法的流程示意图。

图2示出了本申请的另一实施例科技要素检索的智能排序方法的流程示意图。

图3示出了图2所示方法的网络结构。

图4示出了本申请所示方法与传统方法的检索准确度对比示意图。

图5示出了本申请所示方法与传动方法的检索速度对比示意图。

图6示出根据一示例性实施例的一种电子设备的框图。

具体实施方式

以下是通过特定的具体实施例来说明本发明所公开有关“一种科技要素检索的智能排序方法、一种电子设备和一种存储介质”的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。

本申请旨在提供一种科技要素检索的智能排序方法、一种电子设备和一种存储介质。

本申请的一个实施例提供了一种用于科技要素检索的智能排序方法,包括:根据检索关键词确定所述检索关键词的权值向量;根据所述权值向量确定权值;根据所述权值,对数据库内的数据进行排序。

可选地,其中所述权值向量可以包括:专业性权值向量、重复性权值向量和关联性权值向量中的至少一种。

可选地,其中所述根据所述权值向量确定权值可以包括:根据所述权值向量和关联向量确定权值,其中所述关联向量包括:专业性重复性权值向量和重复性关联性权值向量中的至少一种。

可选地,其中所述根据所述权值向量确定权值可以包括:O=W

可选地,其中所述根据所述权值向量确定权值,之后还可以包括:判断所述权值是否收敛。

可选地,其中所述判断所述权值是否收敛之后还可以包括:如果否,则根据所述权值修正所述权值向量;和再次执行所述根据所述权值向量确定权值。

可选地,其中所述根据所述权值,对数据库内的数据进行排序可以包括:按照所述排序输出所述数据库中的数据。

进一步地,其中所述按照所述排序输出所述数据库中的数据可以包括:按照所述排序输出所述数据库中排序靠前的预设数量的数据。

本申请的另一实施例提供了一种电子设备,包括处理器和存储器,以及存储于所述存储器的所述处理器可执行的程序,当所述程序被执行时,所述处理器执行前述至少一种方法。

本申请的另一实施例提供了一种存储介质,存储处理器可执行的程序,当所述程序被执行时,所述处理器执行前述至少一种的方法。

利用上述方法、电子设备和存储介质,提出基于人工神经网络的科技要素检索的智能排序算法,以满足科技要素检索专业性,重复性和关联性的需求。改进了传统神经网络的感知层权重结构,增加了检索专业性,重复性和关联性权重,对用户输入的检索关键字进行感知,通过三层权重网络,输出搜索结果,进而对搜索结果进行排序。可以使得数据检索更准确。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应当理解,本申请的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。本申请的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本申请。如在本申请说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

图1示出了本申请的一个实施例科技要素检索的智能排序方法的流程示意图。

如图1所示,方法1000可以包括:S110、S120和S130。

其中,在S110中可以根据检索关键词确定所述检索关键词的权值向量。可选地,该关键词可以一个关键词也可以是两个或者两个以上关键词。可选地,可以通过获取用户的搜索指令,并从用户的搜索指令中分离关键词。可以从用户的搜索指令中分离出相互独立的至少一个关键词。权值向量的维度可以是从搜索指令中分离出来的关键词的数量。可以包括数据库中的成员与每个关键词之间的关系。其中,权值向量包括:专业性权值向量、重复性权值向量和关联性权值向量中的至少一种。

在S120中可以根据S110中得到的权值向量,确定数据库中每一个成员的权值。可选地,S120可以包括根据所述权值向量和关联向量确定权值,其中所述关联向量包括:专业性重复性权值向量和重复性关联性权值向量中的至少一种。进一步地,在S120可以包括根据下式确定权值。

O=W

其中,O为权值,W

可选地,S120还可以包括判断权值是否收敛。如果判断结果为否则根据权值O修正权值向量,并再次根据式(1)计算权值O。可选地,可以根据循环次数判断是否收敛,也可以通过连续两次计算权值O之间的差异是否小于权值判断是否收敛。

在S130中,可以根据S120中得到的权值进行排序。可选地,在S130中可以按照排序结果,按顺序输出检索结果。进一步地,在S130中还可以根据排序结果,按顺序输出排序靠前的预订数量的数据。

图2示出了本申请的另一实施例科技要素检索的智能排序方法的流程示意图。

如图2所示,方法2000可以包括:S210、S220、S230、S240和S250。

其中,在S210中可以接收用户的搜索指令,并该搜索指令中分离至少一个关键词。进而可以根据该至少一个关键词确定权值向量。可选地,方法2000引入了多重权值向量增加了关键词的专业性、重复性和关联性权重。

如下:

W

W

W

上述3中权重在神经网络模型中为层次结构,两层之间的联系权重为:

W

W

图3示出了图2所示方法的网络结构。

如图3所示,其中x

可以根据关键词向量X中的每一个关键词与数据库中每个文献的专业性特征对比得到每个文献的专业性权值向量初值W

如图2所示,在S220中对于第i次针对O

O

其中,i可以从1开始。

如图2所示,在S230中,可以根据权值O

如果符合用户检索需求,比如用户点击了该文献链接,则W

如果符合多个(j个)用户的检索需求,比如用户点击了该文献链接,则W

如图2所示,在S240中可以判断上述权值计算是否收敛。收敛条件可以包括判断i是否等于m,当i等于m可以判断算法收敛。也可以通过比较相邻两次权值计算结果O

可选地,可以在权值计算不收敛时,对i进行加1计算,并进入步骤S220进行下一轮迭代计算,计算权值O

如图2所示,在S250中可以根据前述中得到的权值进行排序。可选地,在S250中可以按照排序结果,按顺序输出检索结果。进一步地,在S250中还可以根据排序结果,按顺序输出排序靠前的预订数量的数据。

下面以一小数据样例说明本专利的效果:

传统神经网络ANN和申请方法(TLANN)查询的准确度对比如图4所示。由图4可见本申请所提方法相比与传统神经网络略有提升,且在小数据集上的效果更优。查询速度对比如图5所示。本文所提算法速度略低于传统神经网络,但查询时间降低量在0.1s数量级别,用户感知不到此级别的查询速度差别。

图6示出根据一示例性实施例的一种电子设备的框图。

下面参照图6来描述根据本申请的这种实施方式的电子设备200。图6显示的电子设备200仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书描述的根据本申请各种示例性实施方式的方法。例如,所述处理单元210可以执行如图1-5中任意项所示的方法,也可以执行图4-6中任意项所示的方法。

所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。

所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

本申请还提供一个实施例存储介质,存储处理器可执行的程序,当所述程序被执行时,所述处理器执行前述任意一种垃圾产生信息的管理方法,或者当所述程序被执行时,所述处理器执行前述任意一种垃圾回收方法。

利用上述方法、电子设备和存储介质,提出基于人工神经网络的科技要素检索的智能排序算法,以满足科技要素检索专业性,重复性和关联性的需求。改进了传统神经网络的感知层权重结构,增加了检索专业性,重复性和关联性权重,对用户输入的检索关键字进行感知,通过三层权重网络,输出搜索结果,进而对搜索结果进行排序。可以使得数据检索更准确。

本领域技术人员可以理解,本申请的技术方案可实施为系统、方法或计算机程序产品。因此,本申请可表现为完全硬件的实施例、完全软件的实施例(包括固件、常驻软件、微码等)或将软件和硬件相结合的实施例的形式,它们一般可被称为“电路”、“模块”或“系统”。此外,本申请可表现为计算机程序产品的形式,所述计算机程序产品嵌入到任何有形的表达介质中,所述有形的表达介质具有嵌入到所述介质中的计算机可用程序代码。

参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本申请。可以理解的是,可由计算机程序指令执行流程图和/或框图中的每个框、以及流程图和/或框图中的多个框的组合。这些计算机程序指令可提供给通用目的计算机、专用目的计算机或其它可编程数据处理装置的处理器,以使通过计算机或其它可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图的一个框或多个框中指明的功能/动作的装置。

这些计算机程序指令还可存储于能够指导计算机或其它可编程数据处理装置以特定的方式实现功能的计算机可读介质中,以使存储于计算机可读介质中的指令产生包括实现流程图和/或框图中的一个框或多个框中指明的功能/动作的指令装置。

计算机程序指令还可加载到计算机或其它可编程数据处理装置上,以引起在计算机上或其它可编程装置上执行一连串的操作步骤,以产生计算机实现的过程,从而使在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的一个框或多个框中指明的功能/动作的过程。

附图中的流程图和框图示出根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系结构、功能和操作。在这点上,流程图或框图中的每个框可表示一个模块、区段或代码的一部分,其包括一个或多个用于实现特定逻辑功能的可执行指令。还应注意,在一些可替代性实施中,框中标注的功能可以不按照附图中标注的顺序发生。例如,根据所涉及的功能性,连续示出的两个框实际上可大致同时地执行,或者这些框有时以相反的顺序执行。还可注意到,可由执行特定功能或动作的专用目的的基于硬件的系统、或专用目的硬件与计算机指令的组合来实现框图和/或流程图示图中的每个框、以及框图和/或流程图示图中的多个框的组合。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明仅用于帮助理解本申请的方法及其核心思想。同时,本领域技术人员依据本申请的思想,基于本申请的具体实施方式及应用范围上做出的改变或变形之处,都属于本申请保护的范围。综上所述,本说明书内容不应理解为对本申请的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号