首页> 中国专利> 一种融合文本结构信息和语义信息的文本关键词抽取方法

一种融合文本结构信息和语义信息的文本关键词抽取方法

摘要

本发明公开了一种融合文本结构信息和语义信息的文本关键词抽取方法,具体步骤如下:1)对单篇文本的段落进行重新组合,构成新文本;2)对新文本进行预处理,包括分词、词性标注和去除停用词,保留名词和动词作为候选关键词;3)计算每个候选关键词的结构权重;4)计算每个候选关键词的语义权重;5)根据步骤3)所得的结构权重和步骤4)所得的语义权重,计算每个后选关键词的权重,并选择权重最高的K个候选关键词作为文本的关键词。本方法充分利用文本自身结构特点和语义特点,无需依赖领域文本集,且无需进行循环收敛计算,因此简便且效果更好。

著录项

  • 公开/公告号CN113642325A

    专利类型发明专利

  • 公开/公告日2021-11-12

    原文格式PDF

  • 申请/专利权人 上海大学;

    申请/专利号CN202110815799.X

  • 发明设计人 陈雪;王小飞;王鹏;

    申请日2021-07-19

  • 分类号G06F40/289(20200101);G06F40/268(20200101);G06F40/253(20200101);G06F40/30(20200101);G06F40/137(20200101);

  • 代理机构31205 上海上大专利事务所(普通合伙);

  • 代理人何文欣

  • 地址 200444 上海市宝山区上大路99号

  • 入库时间 2023-06-19 13:15:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-17

    实质审查的生效 IPC(主分类):G06F40/289 专利申请号:202110815799X 申请日:20210719

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号