首页> 中国专利> 一种面向百科网站的知识库融合方法

一种面向百科网站的知识库融合方法

摘要

本发明提出了一种面向百科网站的知识库融合方法,对目前影响力最大的百度百科、互动百科和中文维基百科的知识卡片(infobox)进行融合。该方法包含以下步骤:步骤1,获取百科网站关于同一实体的查询结果并进行预处理;步骤2,综合概念相似性、属性相似性及上下文相似性特征对百科网站中的实体建立映射关系;步骤3,对已建立映射关系的实体的知识卡片借助外部词典进行属性对齐;步骤4,对属性值存在冲突的属性,根据属性值是单值型和多值型设计单真值发现方案和多真值发现方案;步骤5,输出融合后的属性‑属性值对。最终得到的三大百科知识卡片的去除冗余的高可靠性的关于实体的属性‑属性值对。

著录项

  • 公开/公告号CN110377747B

    专利类型发明专利

  • 公开/公告日2021-12-07

    原文格式PDF

  • 申请/专利权人 河海大学;

    申请/专利号CN201910495359.3

  • 发明设计人 冯钧;陈菊;

    申请日2019-06-10

  • 分类号G06F16/36(20190101);G06F40/211(20200101);G06F40/295(20200101);G06F40/242(20200101);G06K9/62(20060101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人李淑静

  • 地址 210024 江苏省南京市鼓楼区西康路1号

  • 入库时间 2022-08-23 12:55:42

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号