首页> 中国专利> 一种基于TF-IDF方法优化的新闻关键词提取方法及系统

一种基于TF-IDF方法优化的新闻关键词提取方法及系统

摘要

本发明公开了一种基于TF‑IDF方法优化的新闻关键词提取方法及系统,包括新闻采集模块、新闻分类模块、用户管理模块。采用TF‑IDF‑MP算法对每篇新闻进行分类,并将分类结果存入对应类别中,TF‑IDF‑MP算法结合特征词在语料库中词频的分布情况和在特征词文档中的位置信息,对那些在文档中出现高于特征词词频均值的特征词和更能体现文档主题的文档第一段以及最后一段的名词赋予较高的权重,而对那些低于特征词词频均值的特征词降低权重,通过最终权重分评分,确定新闻关键词以实现对新闻进行分类。

著录项

  • 公开/公告号CN112256843B

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 华东交通大学;

    申请/专利号CN202011521853.1

  • 发明设计人 周会祥;盛武平;

    申请日2020-12-22

  • 分类号G06F16/33(20190101);G06F16/35(20190101);G06F16/951(20190101);

  • 代理机构36129 南昌金轩知识产权代理有限公司;

  • 代理人孙文伟

  • 地址 330013 江西省南昌市经济技术开发区双港东大街808号

  • 入库时间 2022-08-23 11:39:45

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号