首页> 中国专利> 一种基于维基百科双向链接的词语语义相关度判断方法

一种基于维基百科双向链接的词语语义相关度判断方法

摘要

本发明公开了一种基于维基百科双向链接的词语语义相关度判断方法,对于任意两个词语有:S1.在维基百科数据资源库中分别获取两个词语的定位页面;S2.若定位页面为内容页面,即是义项页面,转S3;若定位页面为消歧页面,进行消岐处理,转S3;S3.计算出两个词语每一个义项页面的概念语义解释,概念语义解释为一个双向链接向量;S4.计算两个词语义项页面间的双向链接向量的余弦,获得每一对义项概念间的语义相关度,将最大值作为两个词语的语义相关度。本发明把维基百科中页面的入链接和出链接作为页面特征,构建描述概念语义的特征向量模型,并结合一种基于社会认知度的消岐策略,提高了基于维基百科链接的词语语义相关度计算的准确度。

著录项

  • 公开/公告号CN109325230B

    专利类型发明专利

  • 公开/公告日2021-06-15

    原文格式PDF

  • 申请/专利权人 广西师范大学;

    申请/专利号CN201811108647.0

  • 发明设计人 朱新华;郭青松;张兰芳;陈宏朝;

    申请日2018-09-21

  • 分类号G06F40/30(20200101);G06F40/216(20200101);G06F16/30(20190101);

  • 代理机构45117 南宁东智知识产权代理事务所(特殊普通合伙);

  • 代理人巢雄辉;汪治兴

  • 地址 541004 广西壮族自治区桂林市七星区育才路15号

  • 入库时间 2022-08-23 11:58:14

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号