首页> 中国专利> 基于统计与模板匹配的领域概念自动抽取精化方法及系统

基于统计与模板匹配的领域概念自动抽取精化方法及系统

摘要

本发明公开了一种基于统计与模板匹配的领域概念自动抽取与精化方法,该方法包括:对领域文档中的内容进行分类;针对分类的标题和摘要,通过匹配得到符合“是一个”模式的匹配内容;对匹配内容进行预处理,并提取文档内容中的术语抽取规则和术语词性构成规则;根据术语抽取规则,抽取匹配内容中的知识点,并根据术语词性构成规则对知识点进行初步过滤,加入领域知识点;计算领域知识点中各知识点的词频以及术语领域相关程度,并根据词频和相关程度进行二次过滤,输出结果。本发明在保证一定准确率的前提下最大程度的实现了此过程的自动化,很大程度上提高了知识点抽取的效率,能最大限度的节约人力成本。本发明公开了领域概念自动抽取与精化系统。

著录项

  • 公开/公告号CN105930509B

    专利类型发明专利

  • 公开/公告日2019-05-17

    原文格式PDF

  • 申请/专利权人 华东师范大学;

    申请/专利号CN201610307269.3

  • 发明设计人 吕钊;谢雨飞;

    申请日2016-05-11

  • 分类号G06F16/35(20190101);G06F17/27(20060101);

  • 代理机构31257 上海麦其知识产权代理事务所(普通合伙);

  • 代理人董红曼

  • 地址 200062 上海市普陀区中山北路3663号

  • 入库时间 2022-08-23 10:32:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-30

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F16/35 变更前: 变更后: 申请日:20160511

    专利权人的姓名或者名称、地址的变更

  • 2019-05-17

    授权

    授权

  • 2019-05-17

    授权

    授权

  • 2016-10-05

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160511

    实质审查的生效

  • 2016-10-05

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160511

    实质审查的生效

  • 2016-10-05

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20160511

    实质审查的生效

  • 2016-09-07

    公开

    公开

  • 2016-09-07

    公开

    公开

  • 2016-09-07

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号