首页> 中国专利> 一种社交网站用户中文备注名系统推荐方法

一种社交网站用户中文备注名系统推荐方法

摘要

本发明涉及一种社交网站用户中文备注名系统推荐方法,应用于社交网站,针对好友间备注名的设置,综合考虑网名的长度因素、构成因素,以及其中的字频因素,采用权重计算的方式,能够有效实现系统智能化推荐,不仅适用于用户网名数据量较大的情况,而且还能适用于一位用户拥有很多不同网名的情况和一位用户网名数据量较小的情况。

著录项

  • 公开/公告号CN104573076A

    专利类型发明专利

  • 公开/公告日2015-04-29

    原文格式PDF

  • 申请/专利权人 南京烽火星空通信发展有限公司;

    申请/专利号CN201510041142.7

  • 申请日2015-01-27

  • 分类号G06F17/30;G06F17/27;

  • 代理机构南京经纬专利商标代理有限公司;

  • 代理人杨海军

  • 地址 210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F

  • 入库时间 2023-12-18 08:25:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-23

    专利权的转移 IPC(主分类):G06F17/30 专利号:ZL2015100411427 登记生效日:20230613 变更事项:专利权人 变更前权利人:南京烽火星空通信发展有限公司 变更后权利人:西安烽火软件科技有限公司 变更事项:地址 变更前权利人:210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F 变更后权利人:710077 陕西省西安市长安区坤元路678号

    专利申请权、专利权的转移

  • 2017-11-03

    授权

    授权

  • 2015-05-27

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150127

    实质审查的生效

  • 2015-04-29

    公开

    公开

说明书

技术领域

本发明涉及一种社交网站用户中文备注名系统推荐方法。

背景技术

随着互联网技术的发展,社交网络的出现更加拉近了人们彼此间的距离,在虚拟的网络世界里,人们以网名作为自己的身份,彼此进行着交流,现有的社交网站多种多样,由于网名的情况特殊,其与当事人自身不具备直接的联系,因此,在社交网站中,当两人成为好友,双方即可为对方设置备注名,以便在众多好友中,自己能准确获悉对方是谁;其中,当用户为好友设置备注名时,现有的社交网站系统会自动弹出为此人推荐的备注名,而对于这一技术,现有的备注名推荐方法主要根据社交网络中其他人对该人的备注名以及该人在不同的社交圈子中的备注名出现的频率进行统计加权,出现次数最多的的权值越高,越接近于真实人名;这种方法比较简单且在网络昵称数据量很大的情况下是有效的,但是对于人际关系相对复杂的人来说,其拥有很多不同的称呼,这样基于统计的效果就不太理想,各种昵称敬称等都会干扰到词频统计的效果;同时当网络昵称相对较少的时候,基于统计的效果也同样不甚理想。因此,现有的系统备注名推荐方法已不能适用于现有的社交网络当中。

发明内容

针对上述技术问题,本发明所要解决的技术问题是提供一种应用于社交网站,针对好友间备注名的设置,能够有效实现系统智能化推荐的社交网站用户中文备注名系统推荐方法。

本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种社交网站用户中文备注名系统推荐方法,包括如下步骤:

步骤001.针对目标用户,获取社交网站中对应于该用户的所有网名,作为各个待处理网名,构成该用户的网名信息集合;

步骤002.根据预设网名长度基础权重和预设网名长度权重设定规则,针对该用户网名信息集合中的各个待处理网名,判断其长度,分别获得各个待处理网名的网名长度权重;

步骤003.根据预设分别对应于常用中文姓词库和非常用中文姓词库的常用中文姓基础权重和非常用中文姓基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含中文姓,以及该被包含中文姓属于常用中文姓词库或非常用中文姓词库,以此分别获得各个待处理网名的中文姓权重;

其中,常用中文姓基础权重和非常用中文姓基础权重均大于网名长度基础权重,并且常用中文姓基础权重大于非常用中文姓基础权重;

步骤004.针对该用户网名信息集合,根据中文词频率,获取频率由高至低排列的前n个高频词,构成高频词集合,并且高频词集合中的各个高频词均对应于预设高频词基础权重,其中,n为根据预设个数;

步骤005.根据预设高频词基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含高频词集合中的高频词,以及包含高频词的个数,以此分别获得各个待处理网名的高频词权重;

步骤006.针对该用户网名信息集合中的各个待处理网名,根据待处理网名的网名长度权重、中文姓权重、高频词权重,以及预设分别对应于网名长度、中文姓、高频词的权重系数,进行加权计算获得对应于待处理网名的总权重;

步骤007.获取该用户网名信息集合中总权重最高的待处理网名,作为该用户的系统推荐备注名。

作为本发明的一种优选技术方案:所述步骤001中,所述社交网站中对应于该用户的所有网名包括该用户在社交网站中的当前网名、所有历史网名,以及其他用户针对该用户设置的所有的备注名。

作为本发明的一种优选技术方案:所述步骤002中针对该用户网名信息集合中的各个待处理网名,分别按如下方法进行执行:

获得待处理网名的长度,并判断其是否满足预设的网名基础长度,是则将预设网名长度基础权重赋予该待处理网名,作为该待处理网名的网名长度权重;否则获得该待处理网名长度与预设网名基础长度的差值,根据预设网名长度权重设定规则,由预设网名长度基础权重减去该差值所对应的数值,所获得权重作为该待处理网名的网名长度权重。

作为本发明的一种优选技术方案:所述预设的网名基础长度为2~4位。

作为本发明的一种优选技术方案:所述步骤003中针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:

步骤00301.判断待处理网名中是否包含中文姓,是则进入步骤00302,否则赋予该待处理网名的中文姓权重为0,获得该待处理网名中文姓权重的方法结束;

步骤00302.判断待处理网名中是否包含属于常用中文姓词库的中文姓,是则赋予该待处理网名的中文姓权重为常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束;否则赋予该待处理网名的中文姓权重为非常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束。

作为本发明的一种优选技术方案:所述步骤004中,n为4。

作为本发明的一种优选技术方案:所述步骤005中针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:

步骤00501.判断待处理网名中是否包含高频词集合中的高频词,是则进入步骤00502,否则赋予该待处理网名的高频词权重为0,获得该待处理网名高频词权重的方法结束;

步骤00502.获得该待处理网名包含高频词的个数m,赋予该待处理网名的高频词权重为高频词基础权重×m,获得该待处理网名高频词权重的方法结束。

本发明所述一种社交网站用户中文备注名系统推荐方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明设计的社交网站用户中文备注名系统推荐方法,应用于社交网站,针对好友间备注名的设置,综合考虑网名的长度因素、构成因素,以及其中的字频因素,采用权重计算的方式,能够有效实现系统智能化推荐,不仅适用于用户网名数据量较大的情况,而且还能适用于一位用户拥有很多不同网名的情况和一位用户网名数据量较小的情况。

附图说明

图1为本发明设计社交网站用户中文备注名系统推荐方法的流程图;

图2为本发明设计社交网站用户中文备注名系统推荐方法的实施例应用模块示意图。

具体实施方式

下面结合说明书附图针对本发明的具体实施方式作进一步详细的说明。

如图1和图2所示,本发明设计的一种社交网站用户中文备注名系统推荐方法在实际应用过程当中,实际具体包括如下步骤:

步骤001.针对目标用户,获取社交网站中对应于该用户的所有网名,作为各个待处理网名,构成该用户的网名信息集合,存储于社交网络用户网名存储器中;其中,所述社交网站中对应于该用户的所有网名包括该用户在社交网站中的当前网名、所有历史网名,以及其他用户针对该用户设置的所有的备注名。

实际应用中,采用社交网络用户网名存储器实现针对用户的网名信息集合的存储,这其中,社交网络用户网名存储器采用关系数据库或者nosql数据库或者文件数据库以及其它可行的存储工具,并且社交网络用户网名存储器中针对存储的各个待处理网名,同时关联用户针对网名的使用时间,以及与用户的唯一的标识关联,并且当用户修改网名或者其他人对该用户添加/修改备注名时,系统会将新网名存储至社交网络用户网名存储器中,并与对应用户的唯一标识进行关联。

步骤002.权重计算模块从社交网络存储器中根据用户的唯一标识获取目标用户的所有 的待处理网名,接着,权重计算模块根据预设网名长度基础权重和预设网名长度权重设定规则,针对该用户网名信息集合中的各个待处理网名,判断其长度,分别获得各个待处理网名的网名长度权重;其中,针对该用户网名信息集合中的各个待处理网名,分别按如下方法进行执行:

根据通常中文名字的长度为2-4个字,预设网名基础长度为2~4位,因此,首先获得待处理网名的长度,并判断其是否满足预设的网名基础长度2~4位,是则将预设网名长度基础权重赋予该待处理网名,作为该待处理网名的网名长度权重;否则获得该待处理网名长度与预设网名基础长度的差值,根据预设网名长度权重设定规则,由预设网名长度基础权重减去该差值所对应的数值,所获得权重作为该待处理网名的网名长度权重。

步骤003.权重计算模块根据预设分别对应于常用中文姓词库和非常用中文姓词库的常用中文姓基础权重和非常用中文姓基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含中文姓,以及该被包含中文姓属于常用中文姓词库或非常用中文姓词库,以此分别获得各个待处理网名的中文姓权重;其中,针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:

步骤00301.判断待处理网名中是否包含中文姓,是则进入步骤00302,否则赋予该待处理网名的中文姓权重为0,获得该待处理网名中文姓权重的方法结束;

步骤00302.判断待处理网名中是否包含属于常用中文姓词库的中文姓,是则赋予该待处理网名的中文姓权重为常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束;否则赋予该待处理网名的中文姓权重为非常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束。其中,常用中文姓基础权重和非常用中文姓基础权重均大于网名长度基础权重,并且常用中文姓基础权重大于非常用中文姓基础权重。

并且其中,常用中文姓词库和非常用中文姓词库,根据网上公开提供的统计资料整理得来,包括常用复姓与单姓(150个左右),非常用中文姓词库(1000左右)包含了绝大部分中文姓(去除常用姓)。

步骤004.权重计算模块针对该用户网名信息集合,根据中文词频率,获取频率由高至低排列的前4个高频词,构成高频词集合,并且高频词集合中的各个高频词均对应于预设高频词基础权重。

步骤005.权重计算模块根据预设高频词基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含高频词集合中的高频词,以及包含高频词的个数,以此分别获得各个待处理网名的高频词权重,其中,针对该用户网名信息集合中的各个待处理网名, 分别按如下步骤进行执行:

步骤00501.判断待处理网名中是否包含高频词集合中的高频词,是则进入步骤00502,否则赋予该待处理网名的高频词权重为0,获得该待处理网名高频词权重的方法结束;

步骤00502.获得该待处理网名包含高频词的个数m,赋予该待处理网名的高频词权重为高频词基础权重×m,获得该待处理网名高频词权重的方法结束。;

步骤006.针对该用户网名信息集合中的各个待处理网名,根据待处理网名的网名长度权重、中文姓权重、高频词权重,以及预设分别对应于网名长度、中文姓、高频词的权重系数,进行加权计算获得对应于待处理网名的总权重。

步骤007.获取该用户网名信息集合中总权重最高的待处理网名,作为该用户的系统推荐备注名,由备注名推荐服务模块向用户进行推荐。

上述技术方案设计的社交网站用户中文备注名系统推荐方法,应用于社交网站,针对好友间备注名的设置,综合考虑网名的长度因素、构成因素,以及其中的字频因素,采用权重计算的方式,能够有效实现系统智能化推荐,不仅适用于用户网名数据量较大的情况,而且还能适用于一位用户拥有很多不同网名的情况和一位用户网名数据量较小的情况。

实际应用过程当中,将参照上述方法应用于实施例,具体如下:

步骤001.针对目标用户,获取社交网站中对应于该用户的所有网名,作为各个待处理网名,构成该用户的网名信息集合{张经理;张叔;张国忠;大哥;小忠子;上海公司张;老男人;加勒比海盗眭;敢死队忠爷;傲骨若铁;阿忠;铁哥们;韓液尒钟;>>>丿恋爱;中丨宔角>>>}。

步骤002.根据预设网名长度基础权重L1和预设网名长度权重设定规则,针对该用户网名信息集合中的各个待处理网名,判断其长度,分别获得各个待处理网名的网名长度权重,具体如下:

{张经理=L1;张叔=L1;张国忠=L1;大哥=L1;小忠子=L1;老男人=L1;傲骨若铁=L1;阿忠=L1;铁哥们=L1;韓液尒钟=L1};{上海公司张=L2;加勒比海盗眭=L3;敢死队忠爷=L4;>>>丿恋爱=L5;中丨宔角>>>=L6};其中,网名长度权重L2、L3、L4、L5、L6均小于网名长度权重L1。

步骤003.根据预设分别对应于常用中文姓词库和非常用中文姓词库的常用中文姓基础权重N1和非常用中文姓基础权重N2,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含中文姓,以及该被包含中文姓属于常用中文姓词库或非常用中文姓词库,以此分别获得各个待处理网名的中文姓权重,具体如下:

“张”和“钟”属于常用中文姓词库,则{张经理=N1;张叔=N1;张国忠=N1;阿忠=0;韓液尒钟=N1;上海公司张=N1};“眭”和“铁”属于非常用中文姓词库,则{加勒比海盗眭=N2; 铁哥们=N2;傲骨若铁=N2};而其余的网名中不含中文姓,则{大哥=0;小忠子=0;老男人=0;敢死队忠爷=0;>>>丿恋爱=0;中丨宔角>>>=0}。

步骤004.针对该用户网名信息集合,根据中文词频率,获取频率由高至低排列的前4个高频词,构成高频词集合[忠:4,张:4,哥:2,铁:2]。

步骤005.根据预设高频词基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含高频词集合中的高频词,以及包含高频词的个数,以此分别获得各个待处理网名的高频词权重,具体如下:

{张经理=W1;张叔=W2;张国忠=W3;傲骨若铁=W4;阿忠=W5;铁哥们=W6;韓液尒钟=W7;上海公司张=W8;大哥=W9;小忠子=W10;老男人=W11;敢死队忠爷=W12;>>>丿恋爱=W13;中丨宔角>>>=W14;加勒比海盗眭=W15},其中,其中张国忠=W3和铁哥们=W6高频词权重排名靠前。

步骤006.针对该用户网名信息集合中的各个待处理网名,根据待处理网名的网名长度权重、中文姓权重、高频词权重,以及预设分别对应于网名长度、中文姓、高频词的权重系数,根据如下模型进行加权计算获得对应于待处理网名的总权重;

f=a*Lm+b*Nm+c*Wm

其中,f为待处理网名的总权重,a为网名长度的权重系数,b为中文姓的权重系数,c为高频词的权重系数。

步骤007.将该用户的网名信息集合中的各个待处理网名按其总权重大小由高至低进行排序,具体如下:{张国忠,铁哥们,张叔,张经理,阿忠,大哥,傲骨若铁,韓液尒钟,上海公司张,老男人,小忠子,加勒比海盗,>>>丿恋爱,敢死队忠爷,中丨宔角>>>},获取该用户网名信息集合中总权重最高的待处理网名“张国忠”,作为该用户的系统推荐备注名。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号