首页> 中国专利> 一种基于分层检索的飞行特情处置快速检索方法

一种基于分层检索的飞行特情处置快速检索方法

摘要

本发明提出了一种基于分层检索的飞行特情处置快速检索方法,将检索内容进行中英文分层,第一层为中文,使用中文直接对目标数据库对象进行优先过滤,以缩小检索范围;第二层为除中文以外的其他字符,使用中文拼音首字母将输入文本信息中的中文字符进行替换,并在第一层的检索结果中进行相似度分析比对,二次分析比对采用计算相似度的方式进行,相似度包括词形相似度和词序相似度两部分,以词形相似度起主要作用,词序相似度起次要作用,对于第二次分析后的检索结果进行按照相似度进行排序。相似度方法实现简单,有利于实现快速检索。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-01-18

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20150415 终止日期:20151204 申请日:20121204

    专利权的终止

  • 2015-04-15

    授权

    授权

  • 2013-04-10

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20121204

    实质审查的生效

  • 2013-03-13

    公开

    公开

说明书

技术领域

本发明涉及数据检索技术领域,具体为一种基于分层检索的飞行特情处置快速检 索方法。

背景技术

飞行试验是一项极具风险和挑战的事业,在科研试飞过程中飞行员经常遇到的起 落架不能正常收放、发动机空中停车、发动机空中起火、方向舵飞掉等意外重大紧急 险情,这些特性严重威胁飞行员和飞机的安全。在空中特情发生时,地面指挥人员如 何在短时间内为飞行员提供快速、准确、完整的特情处置策略,对飞行员的生命和飞 机的安全起到决定性的作用。

目前特情应急处置的方法,主要是依靠飞行员和塔台指挥员的记忆或飞行手册中 关于飞行特情的相关内容,而无任何特情处置方法数据库,更无对应于飞行特情背景 下的特情处置信息检索方法。这些特情处置方法数据库建设不成体系,特情处置信息 数据不完善,数据更新维护不到位,缺乏相应的数据检索方法等问题,严重影响了特 情处置的准确性和高效性。

发明内容

要解决的技术问题

为解决现有技术存在的问题,本发明提出了一种基于分层检索的飞行特情处置快 速检索方法,当特情发生时,地面指挥人员或系统操作员采用该方法查询特情处置方 法数据库,快速定位相应的特情处置程序和步骤,准确快速果断地指导目标飞行员采 取应急措施,进而减少决策时间提高特情处置的效率和准确性。

技术方案

本发明中分层检索方法的原理为:将检索内容进行中英文分层,即对输入的文本 信息,按照中英文进行拆分;第一层为中文,使用中文直接对目标数据库对象进行优 先过滤,以缩小检索范围;第二层为除中文以外的其他字符,使用中文拼音首字母将 输入文本信息中的中文字符进行替换,并在第一层的检索结果中进行二次分析比对; 对于第二次分析后的检索结果进行按照相似度进行排序。

本发明的技术方案为:

所述一种基于分层检索的飞行特情处置快速检索方法,其特征在于:包括以下步 骤:

步骤1:提取出输入的查询文本A中的中文字符串和英文字符串,提取出的中文 字符串组成中文字词集合A1,提取出的英文字符串组成英文字词集合A2;

步骤2:使用中文字词集合A1中的元素对特情处置方法数据库进行检索,得到检 索结果集合B=(B1,B2,...,Bn),其中B的每个元素中都出现中文字词集合A1的至 少一个元素;

步骤3:将步骤2中检索结果集合B中的每个元素中的中文字符替换成中文字符 对应的拼音首字母,得到新的检索结果集合C;

步骤4:计算步骤3中新的检索结果集合C的每个元素与步骤1中的英文字词集 合A2的相似度,其中新的检索结果集合C中的元素C1与英文字词集合A2的相似度 的方法包括以下步骤:

步骤4.1:分别计算元素C1与英文字词集合A2中每个元素的词形相似度,然 后求和得到元素C1与英文字词集合A2的词形相似度,其中元素C1与英文字词集合 A2中元素a2的词形相似度WordSim(C1,a2)为:

WordSim(C1,a2)=2×SameWC(C1,a2)len(C1)+len(a2)

其中,len(C1)和len(a2)表示元素C1和元素a2中字母的个数,SameWC(C1,a2)表示元 素a2在元素C1中出现的个数;

步骤4.2:分别计算元素C1与英文字词集合A2中每个元素的词序相似度,然 后求和得到元素C1与英文字词集合A2的词序相似度,其中元素C1与英文字词集合 A2中元素a2的词序相似度OrdSim(C1,a2)为:

若|OnceWS(C1,a2)|>1,则OrdSim(C1,a2)=1-RevOrd(C1,a2)|OnceWS(C1,a2)|-1;

若|OnceWS(C1,a2)|=1,则OrdSim(C1,a2)=1;

若|OnceWS(C1,a2)|=0,则OrdSim(C1,a2)=0;

其中,OnceWS(C1,a2)表示在元素C1和元素a2中都分别出现且都分别都只出现一次的 英文字符串集合,|OnceWS(C1,a2)|表示集合OnceWS(C1,a2)的模;Pfirst(C1,a2)表示 OnceWS(C1,a2)中的各个元素在元素C1中的位置序号构成的向量,Psecond(C1,a2)表 示Pfirst(C1,a2)的分量按对应OnceWS(C1,a2)中各个元素在元素a2中的位置重新排列后 得到的向量,RevOrd(C1,a2)表示Psecond(C1,a2)各相邻分量的逆序数;

步骤4.3:取步骤4.1得到的元素C1与英文字词集合A2的词形相似度的λ1倍, 再与步骤4.2得到的元素C1与英文字词集合A2的词序相似度的λ2倍求和,得到元素 C1与英文字词集合A2的相似度;其中λ1+λ2=1,且λ1>λ2;

步骤5:新的检索结果集合C中与英文字词集合A2的相似度最大的元素作为最 终检索结果。

所述一种基于分层检索的飞行特情处置快速检索方法,其特征在于:将步骤4改 为:

步骤4:计算步骤3中新的检索结果集合C的每个元素与步骤1中的英文字词集 合A2的相似度,其中新的检索结果集合C中的元素C1与英文字词集合A2的相似度 的方法包括以下步骤:

步骤4.1:分别计算元素C1与英文字词集合A2中每个元素的词序相似度, 然后求和得到元素C1与英文字词集合A2的词序相似度,其中元素C1与英文字词集 合A2中元素a2的词序相似度OrdSim(C1,a2)为:

若|OnceWS(C1,a2)|>1,则OrdSim(C1,a2)=1-RevOrd(C1,a2)|OnceWS(C1,a2)|-1;

若|OnceWS(C1,a2)|=1,则OrdSim(C1,a2)=1;

若|OnceWS(C1,a2)|=0,则OrdSim(C1,a2)=0;

其中,OnceWS(C1,a2)表示在元素C1和元素a2中都分别出现且都分别都只出现一次的 英文字符串集合,|OnceWS(C1,a2)|表示集合OnceWS(C1,a2)的模;Pfirst(C1,a2)表示 OnceWS(C1,a2)中的各个元素在元素C1中的位置序号构成的向量,Psecond(C1,a2)表 示Pfirst(C1,a2)的分量按对应OnceWS(C1,a2)中各个元素在元素a2中的位置重新排列后 得到的向量,RevOrd(C1,a2)表示Psecond(C1,a2)各相邻分量的逆序数;

步骤4.2:分别计算元素C1与英文字词集合A2中每个元素的词形相似度,然后 求和得到元素C1与英文字词集合A2的词形相似度,其中元素C1与英文字词集合A2 中元素a2的词形相似度WordSim(C1,a2)为:

WordSim(C1,a2)=2×SameWC(C1,a2)len(C1)+len(a2)

其中,len(C1)和len(a2)表示元素C1和元素a2中字母的个数,SameWC(C1,a2)表示元 素a2在元素C1中出现的个数;

步骤4.3:取步骤4.2得到的元素C1与英文字词集合A2的词形相似度的λ1倍, 再与步骤4.1得到的元素C1与英文字词集合A2的词序相似度的λ2倍求和,得到元素 C1与英文字词集合A2的相似度;其中λ1+λ2=1,且λ1>λ2;

所述一种基于分层检索的飞行特情处置快速检索方法,其特征在于:λ1=0.7, λ2=0.3。

有益效果

本发明将检索内容进行中英文分层,第一层为中文,使用中文直接对目标数据库 对象进行优先过滤,缩小了检索范围,第二层为除中文以外的其他字符,使用中文拼 音首字母将输入文本信息中的中文字符进行替换,并在第一层的检索结果中进行二次 分析比对,二次分析比对采用计算相似度的方式进行,相似度包括词形相似度和词序 相似度两部分,以词形相似度起主要作用,词序相似度起次要作用,相似度方法实现 简单,有利于实现快速检索。

附图说明

图1:本发明的方法流程图。

具体实施方式

下面结合具体实施例描述本发明:

本发明可应用于任何技术性强、高风险、周期长、投资大的综合性系统工程中, 并在科研试飞领域中,进行了试用。下面使用急盘旋下降的例子对本发明的实施进一 步说明:

急盘旋下降是指飞机沿着陡峭的螺旋线轨迹作加速旋转下降的运动,其动态和轨 迹与盘旋下降和螺旋都很接近,飞行员很难在短时间内辨别清楚,一旦形成急盘旋下 降,往往造成极其严重的后果。因此,急盘旋下降是一个不容忽视的特情,是飞行安 全的潜在威胁。

使用基于分层检索的飞行特情处置快速检索方法具体步骤如下:

步骤1:地面操作人员在特情处置系统中输入的查询文本A为“j盘旋xj”,提取 出输入的查询文本A中的中文字符串“盘旋”和英文字符串“j”、“xj”,提取出的中 文字符串组成中文字词集合A1,提取出的英文字符串组成英文字词集合A2。

步骤2:使用中文字词集合A1中的元素对特情处置方法数据库进行检索,得到检 索结果集合B=(B1,B2,...,Bn),其中B的每个元素中都出现中文字词集合A1的至 少一个元素;

本实施例中,中文字词集合A1中只有一个元素“盘旋”,通过检索特情处置方法 数据库,得到检索结果集合B,B中包括两个元素“盘旋上升”和“急盘旋下降”。

步骤3:将步骤2中检索结果集合B中的每个元素中的中文字符替换成中文字符 对应的拼音首字母,得到新的检索结果集合C;

本实施例中,集合C包括两个元素“pxss”和“jpxxj”。

步骤4:计算步骤3中新的检索结果集合C的每个元素与步骤1中的英文字词集 合A2的相似度,其中新的检索结果集合C中的元素C1与英文字词集合A2的相似度 的方法包括以下步骤:

步骤4.1:分别计算元素C1与英文字词集合A2中每个元素的词形相似度,然 后求和得到元素C1与英文字词集合A2的词形相似度,其中元素C1与英文字词集合 A2中元素a2的词形相似度WordSim(C1,a2)为:

WordSim(C1,a2)=2×SameWC(C1,a2)len(C1)+len(a2)

其中,len(C1)和len(a2)表示元素C1和元素a2中字母的个数,SameWC(C1,a2)表示元 素a2在元素C1中出现的个数;

本实施例中,英文字词集合A2包括两个元素“j”和“xj”,集合C包括两个元 素“pxss”和“jpxxj”,所以分别计算“pxss”与“j”和“xj”的词形相似度,然后求 和,得到“pxss”与英文字词集合A2的词形相似度,分别计算“jpxxj”与“j”和“xj” 的词形相似度,然后求和,得到“jpxxj”与英文字词集合A2的词形相似度:

“pxss”与“j”的词形相似度为2×(0/(4+1))=0;

“pxss”与“xj”的词形相似度为2×(0/(4+2))=0;

“jpxxj”与“j”的词形相似度为2×(2/(5+1))=2/3;

“jpxxj”与“xj”的词形相似度为2×(1/(5+2))=2/7;

所以“pxss”与英文字词集合A2的词形相似度为0,“jpxxj”与英文字词集合 A2的词形相似度为2/3+2/7=0.95;

步骤4.2:分别计算元素C1与英文字词集合A2中每个元素的词序相似度,然 后求和得到元素C1与英文字词集合A2的词序相似度,其中元素C1与英文字词集合 A2中元素a2的词序相似度OrdSim(C1,a2)为:

若|OnceWS(C1,a2)|>1,则OrdSim(C1,a2)=1-RevOrd(C1,a2)|OnceWS(C1,a2)|-1;

若|OnceWS(C1,a2)|=1,则OrdSim(C1,a2)=1;

若|OnceWS(C1,a2)|=0,则OrdSim(C1,a2)=0;

其中,OnceWS(C1,a2)表示在元素C1和元素a2中都分别出现且都分别都只出现一次的 英文字符串集合,|OnceWS(C1,a2)|表示集合OnceWS(C1,a2)的模;Pfirst(C1,a2)表示 OnceWS(C1,a2)中的各个元素在元素C1中的位置序号构成的向量,Psecond(C1,a2)表 示Pfirst(C1,a2)的分量按对应OnceWS(C1,a2)中各个元素在元素a2中的位置重新排列后 得到的向量,RevOrd(C1,a2)表示Psecond(C1,a2)各相邻分量的逆序数;

本实施例中,英文字词集合A2包括两个元素“j”和“xj”,集合C包括两个元 素“pxss”和“jpxxj”,所以分别计算“pxss”与“j”和“xj”的词序相似度,然后求 和,得到“pxss”与英文字词集合A2的词序相似度,分别计算“jpxxj”与“j”和“xj” 的词序相似度,然后求和,得到“jpxxj”与英文字词集合A2的词序相似度:

“pxss”与“j”中没有都分别出现且都分别都只出现一次的英文字符串,所以 OnceWS(pxss,j)为空集,所以|OnceWS(pxss,j)|=0,“pxss”与“j”的词序相似度为0;

“pxss”与“xj”中没有都分别出现且都分别都只出现一次的英文字符串,所以 OnceWS(pxss,xj)为空集,所以|OnceWS(pxss,xj)|=0,“pxss”与“xj”的词序相似度为0;

“jpxxj”与“j”中没有都分别出现且都分别都只出现一次的英文字符串,所以 OnceWS(jpxxj,j)为空集,所以|OnceWS(jpxxj,j)|=0,“jpxxj”与“j”的词序相似度为0;

“jpxxj”与“xj”中有都分别出现且都分别都只出现一次的英文字符串“xj”, |OnceWS(jpxxj,xj)|=1,“jpxxj”与“xj”的词序相似度为1;

所以“pxss”与英文字词集合A2的词序相似度为0,“jpxxj”与英文字词集合 A2的词序相似度为0+1=1。

步骤4.3:取步骤4.1得到的元素C1与英文字词集合A2的词形相似度的λ1倍, 再与步骤4.2得到的元素C1与英文字词集合A2的词序相似度的λ2倍求和,得到元素 C1与英文字词集合A2的相似度;其中λ1+λ2=1,由于词形相似度起主要作用,词序 相似度起次要作用,所以λ1>λ2;

本实施例中,λ1=0.7,λ2=0.3,所以“pxss”与英文字词集合A2的相似度为 0×0.7+0×0.3=0,“jpxxj”与英文字词集合A2的相似度为0.95×0.7+1×0.3=0.965。

步骤5:新的检索结果集合C中与英文字词集合A2的相似度最大的元素作为最 终检索结果。

本实施例中,显然“jpxxj”与英文字词集合A2的相似度大于“pxss”与英文字词 集合A2的相似度,所以取“jpxxj”作为最终检索结果,输出“jpxxj”对应的检索结 果集合B中的中文元素“急盘旋下降”。

而后地面操作人员定位到“急盘旋下降”的处置方法,并立即做出处置方案减少 决策时间。急盘旋下降的处置方法如下:一看速度表,发现速度急增时,迅速收光油 门,立即停止拉杆;二看地平仪,手脚协调有力地向旋转的反方向压杆蹬舵,制止旋 转,改平坡度,再向正后方柔和有力地拉杆退出俯冲;需要注意的是,必须在改平坡 度后再向后拉杆,否则,拉杆会使向心力增大,加快旋转,给改出造成困难。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号