首页> 中国专利> 一种用于事件追踪的新闻文本事件、时间抽取及规范化系统

一种用于事件追踪的新闻文本事件、时间抽取及规范化系统

摘要

本发明目的是提供一种用于事件追踪的新闻文本事件、时间抽取及规范化系统,包括数据采集与处理模块(01),新闻文本预处理模块(02),事件及时间实体抽取模块(03),时间规范化模块(04),时间轴建立模块(05);本发明首先对文本进行聚类、词性标注等预处理,然后对处理好的文本进行子事件抽取及规范化,对规范化子事件进行相似度检测,对非重复事件进行时间的抽取与规范化,最后将新子事件插入所属事件时间轴,完成事件的持续追踪。本发明在对时间进行规范化处理时,基元时间的选择不再仅限于当前文本,而是与该事件的前序事件进行持续关联,该方法获取的基元时间更为准确。

著录项

  • 公开/公告号CN112069383A

    专利类型发明专利

  • 公开/公告日2020-12-11

    原文格式PDF

  • 申请/专利权人 杭州叙简科技股份有限公司;

    申请/专利号CN202010894769.8

  • 发明设计人 朱安安;邱彦林;陈尚武;

    申请日2020-08-31

  • 分类号G06F16/953(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F40/253(20200101);G06F40/295(20200101);G06F40/30(20200101);

  • 代理机构11350 北京科亿知识产权代理事务所(普通合伙);

  • 代理人汤东凤

  • 地址 311121 浙江省杭州市余杭区五常街道文一西路998号5幢706、707室

  • 入库时间 2023-06-19 08:04:59

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号