首页> 中国专利> 一种基于海量标准文献数据的语义解析方法及装置

一种基于海量标准文献数据的语义解析方法及装置

摘要

本发明公开了一种基于海量标准文献数据的语义解析方法及装置,该方法具体包括:步骤一:采集获取文字信息,对标准扫描文件进行读取;步骤二:对步骤一中的读取结果进行核对,并对有异议部分进行二次读取修改;步骤三:采集获取公式、图片、表格内容信息,对标准扫描文件进行读取;步骤四:对步骤三中的读取结果进行核对,并对有异议部分进行二次读取修改;步骤五:构建元数据提取系统,通过语义解析建立词库。其解决了同义词和一词多义的问题,建立丰富的词库资源,进而提高海量标准文献数据处理准确度;同时,可单独采集获取公式、图片、表格等内容信息,自动将同一版面的文章、表格等分开,便于分别处理,并按照规定的顺序进行识别。

著录项

  • 公开/公告号CN111814485A

    专利类型发明专利

  • 公开/公告日2020-10-23

    原文格式PDF

  • 申请/专利权人 倪亚晖;

    申请/专利号CN202010657197.1

  • 发明设计人 倪亚晖;武斌;赵锦春;林雪;

    申请日2020-07-09

  • 分类号G06F40/30(20200101);G06F40/247(20200101);G06F40/226(20200101);

  • 代理机构11616 北京盛凡智荣知识产权代理有限公司;

  • 代理人叶培辉

  • 地址 210001 江苏省南京市秦淮区春光里67号601室

  • 入库时间 2023-06-19 08:38:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号