首页> 中国专利> 一种针对突发事件新闻的文本分类方法

一种针对突发事件新闻的文本分类方法

摘要

本发明提供了一种针对突发事件新闻的文本分类方法,属于自然语言处理领域,包括:收集新闻文档,完成数据清洗,及文档的分词、依存分析和指代消解等预处理操作,得到新闻数据集D;将新闻数据集D加入到背景语料,利用Word2Vec训练后学习词的分布式表示;对新闻数据集D中的每篇新闻d进行事件抽取并构造事件词典;采用无参聚类的中文口哨方法对事件词典中的所有事件进行聚类以得到事件簇;对聚类后得到的每个事件簇,计算其出现频率和倒排文档频率,以提取特征事件;根据特征事件为每篇新闻文档构建其特征向量;采用支持向量机的分类算法完成对新闻文档的分类。该方法语义表征能力和类别区分度强。

著录项

  • 公开/公告号CN113515624A

    专利类型发明专利

  • 公开/公告日2021-10-19

    原文格式PDF

  • 申请/专利权人 乐山师范学院;

    申请/专利号CN202110467773.0

  • 发明设计人 孙锐;谢红;

    申请日2021-04-28

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构61223 西安铭泽知识产权代理事务所(普通合伙);

  • 代理人张举

  • 地址 614000 四川省乐山市市中区滨河路778号

  • 入库时间 2023-06-19 12:54:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-21

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号