首页> 中国专利> 构建命名实体标注资源库方法、装置、存储介质和计算机设备

构建命名实体标注资源库方法、装置、存储介质和计算机设备

摘要

本发明涉及一种构建命名实体标注资源库方法、装置、存储介质和计算机设备。本发明使用少量种子库与未标注文本集中的未标注文本构成本轮迭代的资源库进行计算,通过计算未标注文本中每个命名实体的平均效用值,生成下一轮迭代的种子库,再将生成的种子库与其他未标注文本构成下一轮迭代的资源库进行计算出再下一轮的种子库,就这样一直计算直到将未标注文本全部计算,发现新的命名实体,并生成命名实体标注资源库。这种方法计算简单,所得结果的置信度高,适合处理大规模文本。文本数据为一种非结构化数据,通常对非结构化数据进行效果评估都比较困难,而该方法可以实现对文本命名实体进行量化评估。

著录项

  • 公开/公告号CN107329951A

    专利类型发明专利

  • 公开/公告日2017-11-07

    原文格式PDF

  • 申请/专利权人 深圳市牛鼎丰科技有限公司;

    申请/专利号CN201710447680.5

  • 发明设计人 秦兴德;秦祎晗;刘奕慧;郭玮;

    申请日2017-06-14

  • 分类号G06F17/27(20060101);

  • 代理机构44224 广州华进联合专利商标代理有限公司;

  • 代理人谢曲曲

  • 地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2023-06-19 03:42:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-01

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20170614

    实质审查的生效

  • 2017-11-07

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号