首页> 中国专利> 检测数据属性的方法及系统、数据属性分析装置

检测数据属性的方法及系统、数据属性分析装置

摘要

本发明公开了一种检测数据属性的方法及系统、数据属性分析装置,其根据识别结果,确定当前语音通道中传输的媒体流的数据属性,因此能够检测语音通道中传输的媒体流是否为非语音数据,这样才可以有针对性地防止非语音数据通过语音通道传输出去,从而能够提高重要数据信息的安全性。

著录项

  • 公开/公告号CN101083627A

    专利类型发明专利

  • 公开/公告日2007-12-05

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;

    申请/专利号CN200710130070.9

  • 发明设计人 俞洲;孟越涛;许戟;

    申请日2007-07-30

  • 分类号H04L12/56;H04L29/06;H04M7/00;

  • 代理机构北京同达信恒知识产权代理有限公司;

  • 代理人郭润湘

  • 地址 518129 广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2023-12-17 19:24:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-09-15

    授权

    授权

  • 2008-01-30

    实质审查的生效

    实质审查的生效

  • 2007-12-05

    公开

    公开

说明书

技术领域

本发明涉及通信领域,尤其涉及检测数据属性的技术。

背景技术

一些重要的数据信息的安全关系着企业的生存及发展,为此,需要采取措施来减小这些数据信息的安全风险。

在VoIP(Voice over IP,基于IP语音的传输)技术出现以前,可以通过语音通道传输非语音数据文件,例如传真过程中,发送方将用户的非语音数据文件调制成模拟信号,调制解调器将该模拟信号发送到电话线路中传输,接收方的调制解调器在收到该模拟信号后,将其解调成数字信号,发送给传真机,传真机将接收到的数字信号重新组合成非语音数据文件,提供给用户。可见在VoIP技术出现以前,通过语音通道传输非语音数据文件的过程,需要通过电话线,调制解调器或者传真机等设备才能完成,因此做好这些设备的管制工作,在一定程度上,能够减小包含重要数据信息的非语音数据文件通过语音通道传输出去的风险,但同时会增加管理工作的负担。

当VoIP技术出现以后,为通过语音通道传输非语音数据文件提供了更便利的条件,如可以通过PC机将数据信息文件打包成具有语音数据属性的包,使用IP电话、特别是可以安装在PC机上的软电话建立起的语音通道,传输给对方。可见,这样的便利条件无法对包含重要数据信息的非语音数据文件的传输进行控制,从而给重要数据信息的安全带来了很大的隐患。

发明内容

本发明的实施例一方面提供一种检测数据属性的方法及系统、另一方面提供了一种数据属性分析装置,其能够提高重要数据信息的安全性。

本发明的实施例通过如下技术方案实现:

本发明的实施例提供一种检测数据属性的方法,其包括:

获取语音通道中传输的媒体流,对所获取的媒体流进行识别,得到识别结果;

根据所述识别结果,确定所述语音通道中传输的媒体流的数据属性。

本发明的实施例还提供一种检测数据属性的系统,其包括:

识别服务器,用于获取语音通道中传输的媒体流,对所获取的媒体流进行识别,得到识别结果;

数据属性分析装置,用于根据所述识别结果,确定所述语音通道中传输的媒体流的数据属性。

本发明的实施例还提供一种数据属性分析装置,其包括:

获取单元,用于获取语音通道中传输的媒体流的识别结果;

检测单元,用于根据所述识别结果,确定语音通道中传输的媒体流的数据属性。

由上述本发明的实施例提供的具体实施方案可以看出,其根据语音通道中传输的媒体流的识别结果,确定语音通道中传输的媒体流的数据属性,因此能够检测语音通道中传输的媒体流是否为非语音数据,这样才可以有针对性地防止非语音数据通过语音通道传输出去,从而能够提高重要数据信息的安全性。

附图说明

图1为本发明第一实施例的结构图;

图2为本发明第二实施例的流程图;

图3为本发明第三实施例的结构图。

具体实施方式

本发明第一实施例提供了一种检测数据属性的系统,其结构如图1所示,包括:语音交换机、媒体服务器、识别服务器和数据属性分析装置。

其中,语音交换机,完成通信双方(如图1中的用户A与用户B)之间的整个呼叫过程:在呼叫过程中,通信双方会进行媒体流信息的协商,包括使用的编码方式、压缩方式、通讯的端口号等信息;并建立通信双方与系统中的媒体服务器之间的媒体通话连接通道。

媒体服务器,转发通信双方之间交互的媒体流,将一定数量的媒体流进行缓存。

识别服务器,对媒体服务器中的媒体流,进行语音识别,得到相应的语音识别结果,如,单位时间内传输的媒体流中含有的语音文字数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量占有该媒体流中含有的总数据包数量的百分比等信息。

数据属性分析装置,根据所述语音识别结果以及设定的成功识别阈值判断当前通话的媒体流的数据属性为语音数据还是为非语音数据,如将识别服务器的语音识别结果与语音识别结果阈值进行比较,如果比较结果超出设定的成功识别阈值,则确定当前通话的媒体流的数据属性为非语音数据;否则,确定当前通话的媒体流的数据属性为语音数据。如果判断结果为语音数据,则确定不需要对所述媒体流进行处理;若确定当前通话的媒体流的数据属性为非语音数据,则根据事先为不同通信过程配置的策略信息,为当前通话确定控制方式,所述控制方式可以是切断控制方式,也就是说将当前通信过程切断;也可以是干扰控制方式,即对当前通信过程进行干扰,如在当前传输的媒体流中加入噪声等垃圾数据,使接收方难以还原初始数据;也可以是告警等控制方式。

如果确定为切断控制方式,则数据属性分析装置根据该切断控制方式,通知语音交换机根据所述控制方式对当前通话采取切断控制;语音交换机根据所述通知,切断通信双方之间的媒体通话连接通道。

如果确定为干扰控制方式,则数据属性分析装置将根据所述干扰控制方式,通知语音交换机根据所述控制方式对当前通话采取干扰控制;语音交换机根据该通知,向媒体服务器发出相应的指示。媒体服务器根据语音交换机的指示,在当前传输的媒体流中加入噪声等垃圾数据,传输给接收方。

如果确定为告警控制方式,则数据属性分析装置可以直接产生告警信号,以通知网管;也可以根据所述告警控制方式,通知语音交换机,所述语音交换机根据该通知,产生告警信号,以通知网管。

上述数据属性分析装置可以物理上独立,也可以设置在其它设备上,如将其设置在语音交换机上。

上述识别服务器可以物理上独立,也可以设置在其它设备上,如将其设置在媒体服务器上,或将其设置在语音交换机上。

上述是以识别服务器对媒体服务器中的媒体流,进行语音识别为例进行说明的,除此之外,所述识别服务器还可以通过人声检测的方法对媒体服务器中的媒体流进行识别,例如采用频谱模型的方法,将媒体流的频谱分布与一般人声的频谱分布进行对比,若该频谱分布的误差在允许范围内,则可以认为该媒体流的数据属性为语音数据;如果该频谱分布的误差超出范围,则可以认为该媒体流的数据属性为非语音数据,可见根据得到的人声检测结果可以确定出传输的媒体流数据属性为语音数据,或者,非语音数据。将该人声检测结果作为识别服务器的识别结果,相应的,数据属性分析装置可以根据所述识别服务器的识别结果,确定出当前语音通道中传输的媒体流的数据属性为语音数据,还是非语音数据。

上述实施例中也可以仅仅包括识别服务器和数据属性分析装置。该识别服务器用于获取语音通道中传输的媒体流,对所获取的媒体流进行识别,得到识别结果;该识别服务器可以通过采集设备采集语音通道中传输的媒体流,或通过其它方法获取到语音通道中传输的媒体流。

数据属性分析装置,用于根据上述识别服务器的识别结果,确定所述语音通道中传输的媒体流的数据属性。具体处理情况与上述实施例中的相关描述类似,这里不再详细描述。

本发明的第二实施例是一种检测数据属性的方法,其描述了用户A呼叫用户B,并通过为其服务的语音交换机建立用户与媒体服务器之间的媒体通话连接通道,即语音通道;在通过所述媒体通话连接通道进行通信过程中,获取当前语音通道中传输的媒体流,对其进行语音识别,得到相应的语音识别结果;根据所述语音识别结果与设定的成功识别阈值,检测语音通道中传输的媒体流的数据属性。按照事先为不同通信过程配置的策略信息,为传输数据属性为非语音数据的媒体流的通信过程,确定控制方式。具体实施流程如图2所示,包括:

步骤S101,用户A向当前为其服务语音交换机发起对用户B的呼叫请求。该请求中携带用户A的媒体描述信息,其中包括用户A所支持的编码方式、压缩方式,以及用户A的通讯端口号等信息。

步骤S102,当前为用户A服务的语音交换机在收到该请求后,将用户A的媒体描述信息修改为媒体服务器的媒体描述信息,然后向用户B转发该请求。

步骤S103,用户B收到该请求后,生成一个成功应答,发送给当前为其服务的语音交换机。

步骤S104,当前为用户B服务的语音交换机在收到该应答后,将用户B的媒体描述信息修改为媒体服务器的媒体描述信息,然后向用户A转发该应答。所述媒体描述信息中包括可采用的编码方式、压缩方式和/或通讯的端口号等信息等。

经过上述步骤之后,呼叫双方完成了媒体信息的协商,包括可采用的编码方式、压缩方式和/或通讯的端口号等信息;并且,呼叫双方分别与媒体服务器建立媒体通话连接通道,即媒体通话使用的语音通道。之后,在用户A和用户B的通信过程中,二者之间交互的媒体流均经过所述媒体服务器转发,具体如下:

步骤S105a~S105b,通信双方通信过程中交互的媒体流到达媒体服务器,媒体服务器缓存一定数量的媒体流,然后将这些媒体流传输给识别服务器。

步骤S106a~S106b,识别服务器,对得到的媒体流,进行识别,得到相应的识别结果,将所述识别结果传输给数据属性分析装置。

所述识别结果为识别服务器通过语音识别的方法对媒体流进行语音识别后得到的语音识别结果,一般为单位时间内传输的媒体流中含有的语音文字数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量占有该媒体流中含有的总数据包数量的百分比等信息。

识别服务器采用的语音识别方法可以采用现有的语音识别技术,如进行声学特征分析:按照声学特征将单位时间内传输的一段语音媒体流划分成一个个音节(一个音节即为一段连续的数据包,其一般能够被成功识别),在划分音节的过程中会将音节与音节之间的过渡语音段(过渡语音段也是一段连续的数据包,其一般不能被识别)丢弃,从而形成一个识别结果:单位时间内传输的媒体流中含有的能够成功识别的音节所占用的数据包及其占总数据包的百分比。

在完成声学特征分析后按照声学模型进行配对,即将成功识别的音节与字对应起来,一般语音识别在识别过程中会对音节与字的配对进行打分,得分高于阈值的即被接受,不然就不识别,从而形成第二个识别结果:单位时间内传输的媒体流中含有的成功识别的语音文字。

采用语言模型,对上述成功识别出的语音文字进行纠正,可以得到相应的识别结果,单位时间内传输的媒体流中含有的能够成功识别的语音文字数量。

识别服务器,将上述语音识别结果,或其中一个语音识别结果传输给数据属性分析装置。

步骤S107,数据属性分析装置,根据所述语音识别结果以及设定的成功识别阈值,确定当前语音通道中传输的媒体流的数据属性,如果当前通话的媒体流的数据属性为语音数据,数据属性分析装置则不进行任何处理;如果当前通话的媒体流的数据属性为非语音数据,则根据事先为不同的通信过程配置的策略信息,为传输数据属性为非语音数据的媒体流的通信过程,确定相应的控制方式,然后执行步骤S108根据所确定的控制方式通知语音交换机进行相应的处理;或者,根据所确定的控制方式自己进行相应的处理(图中只给出了根据所确定的控制方式通知语音交换机进行相应的处理的情况)。

步骤S107中,所述设定的成功识别阈值可以事先配置在所述数据属性分析装置中,或,事先配置在所述数据属性分析装置所在的系统的配置信息中。所述设定的成功识别阈值可以是单位时间内传输的媒体流中含有的语音文字数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量,或者,单位时间内传输的媒体流中含有的能够成功识别的数据包数量占有该媒体流中含有的总数据包数量的百分比等信息。数据属性分析装置根据所述语音识别结果以及设定的成功识别阈值,确定当前语音通道中传输的媒体流的数据属性时,可以将所述语音识别结果与设定的成功识别阈值进行比较,如果比较结果为所述语音识别结果超出设定的成功识别阈值,则确定当前语音通道中传输的媒体流的数据属性为非语音数据;否则,确定当前语音通道中传输的媒体流的数据属性为语音数据。

例如,假设预定的第一成功识别阈值为70%,能够成功识别的语音识别结果,如单位时间内传输的媒体流中含有的能够成功识别的数据包数量占有该媒体流中含有的总数据包数量的百分比,与其比较,发现超过70%,则认为单位时间内传输的媒体流的数据属性为语音数据;

如果未超过70%,则再进行下一项指标的判断,将单位时间内传输的媒体流中含有的能够成功识别的语音文字数量,与对应的设定的成功识别阈值比较,若超过设定的成功识别阈值,则认为单位时间内传输的媒体流的数据属性为语音数据;若没有超过,则认为单位时间内传输的媒体流的数据属性为非语音数据。

步骤S107中根据事先配置的策略信息,为当前传输数据属性为非语音数据的媒体流的通信过程,确定的控制方式可以为切断控制方式,也就是说将当前通信过程切断;或者干扰控制方式,即对当前通信过程进行干扰,如在当前传输的媒体流中加入噪声等垃圾数据,使接收方难以还原初始数据;或者采用告警等控制方式。

如果所确定的控制方式为切断控制方式,则所述数据属性分析装置根据该切断控制方式,通知语音交换机对当前通信过程采取切断控制;语音交换机根据所述通知,切断通信双方之间的媒体通话连接。

如果所确定的控制方式为干扰控制方式,则所述数据属性分析装置将根据所述干扰控制方式,通知语音交换机根据所述控制方式对当前通信过程采取干扰控制;语音交换机根据该通知,向媒体服务器发出相应的指示。媒体服务器根据语音交换机的指示,在当前传输的媒体流中加入噪声等垃圾数据,传输给接收方。

如果所确定的控制方式为告警控制方式,则所述数据属性分析装置可以根据所述告警控制方式,通知语音交换机,所述语音交换机根据该通知,产生告警信号,以通知网管。也可以根据所确定的控制方式自己进行相应的处理,也就是说直接产生告警信号,以通知网管。

上述第二实施例是以识别服务器对媒体服务器中的媒体流,进行语音识别为例进行说明的,除此之外,所述识别服务器还可以通过目前现有的人声检测的方法对媒体流进行识别,例如采用频谱模型的方法,将媒体流的频谱分布与一般人声的频谱分布进行对比,若该频谱分布的误差在允许范围内则可以认为该媒体流的数据属性为语音数据,如果该频谱分布的误差超出范围,则可以认为该媒体流的数据属性为非语音数据,可见,最终获得的人声检测结果中包含有所检测的媒体流为语音数据还是非语音数据的信息,所述识别服务器将人声检测结果作为识别结果传输给数据属性分析装置。因此,数据属性分析装置可以直接根据人声检测结果,确定出当前语音通道中传输的媒体流的数据属性为语音数据,还是非语音数据。

本发明的第三实施例提供了一种数据属性分析装置,其结构如图3所示,包括:获取单元和检测单元,其中所述检测单元可以进一步包括比较子单元和检测子单元。为了进一步对当前通话进行控制,所述数据属性分析装置还可以进一步包括控制方式确定单元和控制单元。所述控制单元可以进一步包括第一控制子单元和/或第二控制子单元。

获取单元,用于获取语音通道中传输的媒体流的识别结果;其中,该获取单元可以从识别服务器中获取语音识别结果。

检测单元,用于根据所述识别结果,确定语音通道中传输的媒体流的数据属性。其中,该检测单元包括:

比较子单元,将所述获取单元所获取到的语音识别结果与设定的成功识别阈值进行比较;所述设定的成功识别阈值可以事先配置在所述数据属性分析装置中,或,事先配置在所述数据属性分析装置所在的系统的配置信息中。然后将得到的比较结果传输给所述检测子单元;

检测子单元,发现比较结果为所述语音识别结果超出设定的成功识别阈值时,则确定语音通道中传输的媒体流的数据属性为非语音数据;发现比较结果为所述语音识别结果小于或等于设定的成功识别阈值时,则确定语音通道中传输的媒体流的数据属性为语音数据。

控制方式确定单元,用于按照为不同的通信过程配置的策略信息,为传输数据属性为非语音数据的媒体流的通信过程,确定控制方式。所确定的控制方式可以为切断控制方式,也就是说将当前通信过程切断;或者干扰控制方式,即对当前通信过程进行干扰,如在当前传输的媒体流中加入噪声等垃圾数据,使接收方难以还原初始数据;或者采用告警等控制方式。

控制单元,根据控制方式确定单元所确定的控制方式,对传输非语音数据的通信过程进行控制。具体处理情况如下:

第一控制子单元,通知通信双方归属的语音交换机对传输非语音数据的通信过程进行控制。具体处理情况与第一实施例中的相关描述雷同,这里不再详细描述。

第二控制子单元,用于根据控制方式确定单元所确定的控制方式,自行对传输非语音数据的通信过程,进行相应的控制。如对利用当前语音通道传输非语音数据的通信过程,产生告警信号,以通知网管。其余与第二实施例基本类似,这里不再详细描述。

本发明的第四实施例还提供了另一种数据属性分析装置,其包括获取单元和检测单元,其中所述检测单元可以包括数据属性确定子单元。为了进一步对当前通话进行控制,所述数据属性分析装置还可以进一步包括控制方式确定单元和控制单元。所述控制单元可以进一步包括第一控制子单元和/或第二控制子单元。

其中,控制方式确定单元、控制单元,以及控制单元中的第一控制子单元和/或第二控制子单元的功能,与第三实施例中的相应单元的功能雷同,这里不再详细描述,下面仅仅对获取单元、检测单元的功能进行描述:

获取单元用于获取语音通道中传输的媒体流的识别结果,其可以从识别服务器中获取人声检测结果。

检测单元,用于根据所述获取单元获取到的识别结果,确定语音通道中传输的媒体流的数据属性。其中,该检测单元包括:

数据属性确定子单元,根据获取单元所获取到的人声检测结果,确定出语音通道中传输的媒体流的数据属性为语音数据,还是非语音数据。

由上述本发明实施例提供的具体实施方案可以看出,其通过根据识别结果,确定语音通道中传输的媒体流的数据属性的方法,能够检测语音通道中传输的媒体流是否为非语音数据,这样才可以有针对性地防止非语音数据通过语音通道传输出去,从而能够提高重要数据信息的安全性。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号