首页> 中国专利> 一种基于文本信息的术语提取方法、系统和设备

一种基于文本信息的术语提取方法、系统和设备

摘要

本发明公开了一种基于文本信息的术语提取方法,包括:获取待处理文本,对所述待处理文本进行预处理;从所述待处理文本中提取满足互信息判定指标和上下文依赖判定指标的词语收录进种子词集合中;基于所述种子词集合的节点以及所述节点的边构建种子词网络;定义所述节点的权值,并通过预设模型迭代所述节点的权值直至所述节点的权值收敛;对所述节点的权值进行排序,当按顺序排列的种子词形成相邻词组时,提取所述相邻词组作为候选术语。本发明还公开一种基于文本信息的术语提取系统和一种基于文本信息的术语提取设备。采用本发明实施例,能充分考虑中文语法层次的问题,具有自动化、动态更新的特点,符合现代海量文本术语高速抽取的需求。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-12

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20190123

    实质审查的生效

  • 2019-06-18

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号