首页> 中国专利> 一种从文章中获取结构化标签的方法

一种从文章中获取结构化标签的方法

摘要

本发明公开了一种从文章中获取结构化标签的方法,通过创立多个单独的特征库,每个特征库中的特征词任意两个或多个自由组合形成特征词集合圈;先从文章的全文中截取文章的标题以及首尾段,并提取剩余的关键词;将该新的特征库中的所有关键词组合形成若干个特征词集合圈;与特征库进行类比,找到相同和相邻的所有特征词集合圈,优选交集和相差的关键词组合成文章预选的结构化标签;将文章除了首尾部分提取关键词形成新的特征库,形成文章预选的结构化标签;交、差集形成结构化标签和附加补充的结构化标签。本发明可以快速从文件中提取出需要的文章结构化标签,无需对全部的文章内容进行结构化标签提取,提高了文章结构化标签的处理速度。

著录项

  • 公开/公告号CN113032517B

    专利类型发明专利

  • 公开/公告日2022-05-03

    原文格式PDF

  • 申请/专利权人 厦门铠甲网络股份有限公司;

    申请/专利号CN201911355434.2

  • 发明设计人 陈滨;梁晓斌;

    申请日2019-12-25

  • 分类号G06F16/33;G06F16/35;G06F40/289;

  • 代理机构泉州企记知识产权代理事务所(普通合伙);

  • 代理人许寿宁

  • 地址 361000 福建省厦门市软件园观日路26号202A

  • 入库时间 2022-08-23 13:34:47

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号