首页> 中国专利> 基于非结构化文档的知识提取方法及系统

基于非结构化文档的知识提取方法及系统

摘要

本发明公开了基于非结构化文档的知识提取方法及系统,包括如下步骤,建立随机森林模型、导入非结构化文档、BERT处理、样本导入、展示提取的知识、对随机森林模型进行补充和修正,本发明结构科学合理,使用安全方便,通过BERT对非结构化文档进行预处理,通过双向特征,筛出词义准确的字词,保证知识提取的准确性,同时将决策后的知识字词进行展示,通过分为三类,便于使用者更准确了解非结构化文档的关键信息和次要信息,提高随机森林模型对非结构化文档字词的提取,同时数据存储内部存储有和字词相关的知识文档,并将提取的字词与字词相关的知识文档链接,通过点击字词能快速了解字词相关知识,提高对非结构化文档的了解。

著录项

  • 公开/公告号CN110275938B

    专利类型发明专利

  • 公开/公告日2021-09-17

    原文格式PDF

  • 申请/专利权人 广州伟宏智能科技有限公司;

    申请/专利号CN201910455327.0

  • 申请日2019-05-29

  • 分类号G06F16/33(20190101);G06F16/335(20190101);G06F40/247(20200101);

  • 代理机构44452 广州蓝晟专利代理事务所(普通合伙);

  • 代理人陈梓赫;栾洋洋

  • 地址 510660 广东省广州市天河区车陂启明大街93号安定楼B栋4楼401-404室

  • 入库时间 2022-08-23 12:29:39

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号