首页> 中国专利> 结合短信内容和发送频次识别垃圾短信源的系统与方法

结合短信内容和发送频次识别垃圾短信源的系统与方法

摘要

本发明公开了一种结合短信内容和发送频次识别垃圾短信源的系统与方法,包括参数配置界面模块、采集所有短信息发送到业务模块、接收管理模块发送的拦截信息的实时采集拦截模块、接收管理模块发送的参数配置、统计用户短信息、识别出达到设定阈值的短信源、发送超限短信源的所有信息到管理模块的业务模块;接收业务模块的超限信息并记录、发送拦截信息到实时采集拦截模块的管理模块。该方法根据内容计算内容特征值,按照特征值统计短信源相同内容的短信数量,只拦截短信源发送的内容达到特征值发现条件的短信,然后再次统计同时拦截的特征值的个数,达到黑名单条件的则列入黑名单。本发明能够提高垃圾短信识别准确率,减少垃圾短信拦截误拦率。

著录项

  • 公开/公告号CN101790142A

    专利类型发明专利

  • 公开/公告日2010-07-28

    原文格式PDF

  • 申请/专利权人 上海粱江通信系统股份有限公司;

    申请/专利号CN201010121851.3

  • 发明设计人 宋树成;肖克华;

    申请日2010-03-11

  • 分类号H04W4/14(20090101);H04W88/18(20090101);

  • 代理机构上海兆丰知识产权代理事务所(有限合伙);

  • 代理人章蔚强

  • 地址 200136 上海市浦东新区金桥路1398号金台大厦10楼

  • 入库时间 2023-12-18 00:05:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-08

    未缴年费专利权终止 IPC(主分类):H04L12/56 授权公告日:20121114 终止日期:20180311 申请日:20100311

    专利权的终止

  • 2012-11-14

    授权

    授权

  • 2011-01-26

    实质审查的生效 IPC(主分类):H04W4/14 申请日:20100311

    实质审查的生效

  • 2010-07-28

    公开

    公开

说明书

技术领域

本发明涉及电信领域,尤其涉及垃圾短信的监控治理,采用纯频次和关键字基础上结合短信内容和发送频次识别垃圾短信源的系统与方法。

背景技术

短信息服务作为移动通信网络的一种基本业务,在为用户提供便捷消息通信服务的同时,也为信息垃圾的传播提供了渠道。而垃圾短信息有着愈演愈烈的趋势,垃圾短信不但带来用户投诉的不良影响,还存在恶意欠费问题,因此需要对垃圾短信进行实时监控拦截。

垃圾短信的发送特征有:

1、字数较多;

2、内容重复;

3、发送频次较高。

当前垃圾短信短信源发现的手段大多基于纯频次统计和关键字拦截,规则较简单,容易被垃圾短信的发送者找出其中的规律,采用慢速发送不同内容的垃圾短信的方式则可规避现有的垃圾短信识别和拦截系统。因此现有技术需要进一步完善,识别出此种短信源,限制该短信源发送短信。

发明内容

本发明的目的在于克服现有技术的缺陷,而提供一种结合短信内容和发送频次识别垃圾短信源的系统与方法,它能够深度的识别垃圾短信用户,提高识别垃圾短信源广度,提高垃圾短信用户的识别准确率,有效减少垃圾短信的漏拦数量。

实现上述目的的技术方案是:

本发明之一的一种结合短信内容和发送频次识别垃圾短信源的系统,其中,包括界面配置模块、业务模块、管理模块和实时采集拦截模块,其中:

所述的界面配置模块对参数进行配置,并将该参数配置信息发送到所述的管理模块,所配置的参数包括短信的特征值、特征值发现条件、以及黑名单条件;

所述的特征值是经过计算短信内容后的数值,不同内容有不同的数值,在每条短信属性中增加此特征值;

所述的特征值发现条件为短信源在时间范围内发送的具有相同特征值的短信数量超出预先设定最大阈值时,则拦截此短信源的符合此特征值的短信;

所述的黑名单条件为在设定的时间范围内短信源达到特征值发现条件的不同特征值个数超过该最大阈值时,判定此短信源为垃圾短信号码,拦截此用户所有短信;

所述的管理模块包括一数据库,该管理模块接收界面配置模块的参数配置信息,将该信息保存到所述的数据库中,并同步该参数配置信息到所述的业务模块;同时它接收业务模块的短信源和特征值的超限信息,保存到数据库并将相应的短信源和特征值拦截信息发送到所述的实时采集拦截模块,由实时采集拦截模块拦截短信源和特征值配对的短信;所述管理模块进一步判断短信源的特征值数是否达到黑名单最大阈值,如果达到此阈值,则转换此短信源为黑名单,并同步到所述的实时采集拦截模块;

所述的业务模块接收实时采集拦截模块采集到的短信,并对其进行统计,按照短信内容计算其对应的特征值,按照短信源和特征值的结合来判断短信源是否达到特征值发现条件,并将该信息作为超限信息发送给所述的管理模块;

所述的实时采集拦截模块采集经过系统的所有短信源发出的短信,并根据从所述的管理模块接收到的拦截信息对短信进行拦截。

上述的结合短信内容和发送频次识别垃圾短信源的系统,其中,所述的业务模块包括一用于短信实时业务统计的短信内存数据库。

上述的结合短信内容和发送频次识别垃圾短信源的系统,其中,所述管理模块中的数据库用于记录短信源和特征值、配置的参数、以及拦截短信。

上述的结合短信内容和发送频次识别垃圾短信源的系统,其中,所述的实时采集拦截模块包括一内存数据库,该内存数据库用于记录短信源属性和特征值。

上述的结合短信内容和发送频次识别垃圾短信源的系统,其中,所述的业务模块发送给管理模块的超限信息包括有记录短信源发送短信的时间、主叫号码及其特征值属性。

本发明之二的一种结合短信内容和发送频次识别垃圾短信源的方法,其中:

在设定的时间范围内记录短信源发送的每条短信,在每条短信属性中增加短信内容特征值;

设定特征值发现条件,该特征值发现条件为短信源在时间范围内发送的具有相同特征值的短信数量的最大阈值,当设定的时间范围内短信源发送的具有相同特征值的短信数量超出该最大阈值时,拦截此短信源的符合此特征值的短信;

设定黑名单条件,即在设定的时间范围内短信源达到特征值发现条件的不同特征值个数的最大阈值,当设定的时间范围内短信源被拦截的不同特征值的个数超过该最大阈值时,判定此短信源为垃圾短信号码,拦截此用户所有短信。

上述的结合短信内容和发送频次识别垃圾短信源的方法,其中,包括下列步骤:

步骤S0.设定特征值,即在每条短信属性中增加短信内容特征值;

步骤S1.设定特征值发现条件A,即设定短信源在时间段P内发送具有同样特征值的短信的个数的最大阈值M1,其中,P为正数,M1为正整数;

步骤S2.设定黑名单条件B,即在时间范围内设定短信源达到特征值发现条件A的不同特征值个数的最大阈值M2,其中,M2为正整数;

步骤S3.接收短信;

步骤S4.根据短信内容计算特征值;

步骤S5.存入短信队列,即记录短信源发送短信的时间、主叫号码及其特征值置于一短信队列中;

步骤S6.判断在时间段P内此号码的特征值是否达到了特征值发现条件A,即判断在时间段P内此号码的具有同样特征值的短信的个数是否达到了特征值发现条件A中的最大阈值M1,

若没有达到最大阈值M1,则清除此短信源的过期短信,保留指定时间段内的短信,记录每条短信的时间和特征值,并返回步骤S3,继续监测;

若达到最大阈值M1,则清除此短信源的过期短信,拦截此短信源符合此特征值的短信,然后进入步骤S7;

步骤S7.判断该号码的特征值是否达到黑名单条件B,即判断步骤S6中达到最大阈值M1的不同特征值个数是否达到了黑名单条件B中的最大阈值M2,

若没有达到最大阈值M2,则此短信源不列入黑名单,只拦截此短信源符合特征值发现条件A的短信,然后转到步骤S8;

若达到最大阈值M2,则进入步骤S9;

步骤S8.增加短信源和特征值的关联,拦截此短信源达到最大阈值M1但未达到最大阈值M2的特征值的短信,然后返回步骤S3;

步骤S9.该号码为垃圾短信号码,将该短信源列入垃圾短信短信源,进入黑名单;

步骤S10.拦截步骤S9中的短信源的所有短信。

上述的结合短信内容和发送频次识别垃圾短信源的方法,其中,步骤S0中,设定特征值时,每一短信的不同内容对应不同的特征值,计算特征值时,采用MD5算法。

上述的结合短信内容和发送频次识别垃圾短信源的方法,其中,步骤S5中,所述短信队列中,不同的短信源置于不同的短信队列中。

本发明的有益效果是:本发明根据内容计算内容特征值,按照特征值统计短信源相同内容的短信数量,提高了系统的统计效率,只拦截短信源发送的内容达到特征值发现条件的短信,然后再次统计短信源同时拦截的特征值的个数,达到黑名单条件的则列入黑名单。通过此方法,可以识别和拦截发送短信内容相同的短信源的符合特征值的短信,不拦截未达到特征值发现条件的短信,只有同时拦截的特征值超出阈值时才全部拦截短信源的短信。用户如只是偶尔发送大量相同内容短信,不会列入垃圾短信用户,避免了错误的把正常短信源列入垃圾短信短信源。

附图说明

图1是本发明之一的结合短信内容和发送频次识别垃圾短信源的系统的结构示意图;

图2是本发明之二的一实施例的工作流程图;

图3是本发明之二的有内容特征值的短信队列示意图;

图4是本发明之二的拦截内容特征值队列示意图。

具体实施方式

下面将结合附图对本发明作进一步说明。

请参阅图1,图中示出了本发明之一的一种结合短信内容和发送频次识别垃圾短信源的系统,包括界面配置模块1、业务模块2、管理模块3和实时采集拦截模块4,其中:

界面配置模块1对参数进行配置,并将该参数配置信息发送到管理模块3,所配置的参数包括短信的特征值、特征值发现条件、以及黑名单条件;

特征值是经过计算短信内容后的数值,不同内容有不同的数值,在每条短信属性中增加此特征值;

特征值发现条件为短信源在时间范围内发送的具有相同特征值的短信数量超出预先设定最大阈值时,则拦截此短信源的符合此特征值的短信;

黑名单条件为在设定的时间范围内短信源达到特征值发现条件的不同特征值个数超过该最大阈值时,判定此短信源为垃圾短信号码,拦截此用户所有短信;;

管理模块3包括一数据库31,该管理模块3接收界面配置模块1的参数配置信息,将该信息保存到数据库31中,并将该参数配置信息同步到业务模块2;同时管理模块3接收业务模块2的短信源和特征值超限信息,保存到数据库31,并将相应的短信源和特征值的拦截信息同步到实时采集拦截模块4,由采集拦截模块4拦截短信源和特征值配对的短信;管理模块3进一步判断短信源的特征值数是否达到黑名单最大阈值,如果达到此阈值,则转换此短信源为黑名单,并同步到实时采集拦截模块4中,实时采集拦截模块4拦截后续的短信源发送的短信;管理模块3中的数据库31用于记录短信源和特征值、配置的参数、以及拦截短信;

业务模块2接收实时采集拦截模块4采集到的短信并对其进行统计,按照短信内容计算其对应的特征值,按照短信源和特征值的结合来判断短信源是否达到特征值发现条件,并将该信息作为超限信息发送给管理模块3,业务模块2发送给管理模块3的超限信息包括有记录短信源发送短信的时间、主叫号码及其特征值属性,业务模块2包括一用于短信实时业务统计的短信内存数据库21;

实时采集拦截模块4采集经过系统的所有短信源发出的短信,并根据从管理模块3接收到的拦截信息对短信进行拦截,该实时采集拦截模块4包括一内存数据库41,该内存数据库用于记录短信源属性和特征值。

本发明之二的一种结合短信内容和发送频次识别垃圾短信源的方法,包括:

在设定的时间范围内记录短信源发送的每条短信,在每条短信属性中增加短信内容特征值,根据短信内容来计算其特征值;

设定特征值发现条件,该特征值发现条件为短信源在时间范围内发送的具有相同特征值的短信数量的最大阈值,当设定的时间范围内短信源发送的具有相同特征值的短信数量超出该最大阈值时,识别出用户短信源和特征值属性等信息,拦截此短信源的符合此特征值的短信;

设定黑名单条件,即在设定的时间范围内短信源达到特征值发现条件的不同特征值个数的最大阈值,当设定的时间范围内短信源被拦截的不同特征值的个数超过该最大阈值时,判定此短信源为垃圾短信号码,拦截此用户所有短信。

下面将结合一实施例对本发明作进一步说明。

请参阅图2,为本发明的一实施例的流程图,包括以下步骤:

步骤S 0.设定特征值,即在每条短信属性中增加短信内容特征值,设定特征值时,每一短信的不同内容对应不同的特征值,计算方法可采用公知的MD5算法;

步骤S1.设定特征值发现条件A,即设定短信源在时间段P内发送具有同样特征值的短信的个数的最大阈值M1,其中,P为正数,M1为正整数,本实施例中M1为10条同样特征值/天;

步骤S2.设定黑名单条件B,即在时间范围内设定短信源达到特征值发现条件A的不同特征值个数的最大阈值M2,其中,M2为正整数,本实施例中,M2为3条,即同时存在的三条特征值则转为黑名单;

步骤S3.接收短信;

步骤S4.根据短信内容计算特征值;

步骤S5.存入短信队列,即记录短信源发送短信的时间、主叫号码及其特征值置于一短信队列中,短信队列中,不同的短信源置于不同的短信队列中;

步骤S6.判断在时间段P内此号码的特征值是否达到了特征值发现条件A,即判断在时间段P内此号码的具有同样特征值的短信的个数是否达到了特征值发现条件A中的最大阈值M1,

若没有达到最大阈值M1,则清除此短信源的过期短信,保留指定时间段内的短信,记录每条短信的时间和特征值,并返回步骤S3,继续监测;

若达到最大阈值M1,则清除此短信源的过期短信,拦截此短信源符合此特征值的短信,然后进入步骤S7;

步骤S7.判断该号码的特征值是否达到黑名单条件B,即判断步骤S6中达到最大阈值M1的不同特征值个数是否达到了黑名单条件B中的最大阈值M2,

若没有达到最大阈值M2,则此短信源不列入黑名单,只拦截此短信源符合特征值发现条件A的短信,然后转到步骤S8;

若达到最大阈值M2,则进入步骤S9;

步骤S8.增加短信源和特征值的关联,拦截此短信源达到最大阈值M1但未达到最大阈值M2的特征值的短信,然后返回步骤S3;

步骤S9.该号码为垃圾短信号码,将该短信源列入垃圾短信短信源,进入黑名单;

步骤S10.拦截步骤S9中的短信源的所有短信。

请参阅图3,本发明之二的一实施例的有内容特征值的短信队列示意图,它在采用内容特征值,计算短信内容的频次,超出此特征值频次的短信源。附图3中,短信内容的特征值设置实例如下:

1bb5197c2fcc7c46f148619e40bb9a4a:恭喜!您的飞信账号已被抽取为《非常6+1》栏目李咏砸蛋活动砸中幸运二等奖,请登陆活动网http://fetiorn.com.cn查收,请牢记您的验证码1688;

32dec99fcc830c0d7dc6896eb7bd8b4d:尊敬的用户您好!根据10月话费额度调查,您将会获得50元话费奖励机会,拨打1259042982按2键6分钟后即可领取。

主叫短信源8613988888888发送的短信中重复内容特征值为1bb5197c2fcc7c46f148619e40bb9a4a和32dec99fcc830c0d7dc6896eb7bd8b4d,系统拦截主叫短信源8613988888888符合该特征值的短信。

请参阅图4,本发明之二的拦截内容特征值队列示意图,附图4中的主叫短信源的拦截特征值个数为3,已经达到黑名单条件,系统拦截主叫短信源所有的短信内容。

本发明可应用于短信优化系统,采用了这种方法,证明可行有效,减少了垃圾短信的误拦率,提高了垃圾短信源识别的广度。

以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号