首页> 中国专利> 一种融合主题信息和词向量提取文本特征的新闻分类方法

一种融合主题信息和词向量提取文本特征的新闻分类方法

摘要

本发明涉及一种融合主题信息和词向量提取文本特征的新闻分类方法。本发明所述的一种融合主题信息和词向量提取文本特征的新闻分类方法包括:使用Word2vec和LDA模型分别在语料库中训练词向量,word2vec经过TF‑IDF进行加权所得的词向量与LDA训练的特征扩展模型进行拼接得到短文本表示模型,将短文本表示模型输入到BIGRU中提取文本深层次信息的特征向量,最后使用softmax函数得到文本分类结果。本发明所述的一种融合主题信息和词向量提取文本特征的新闻分类方法,在提取过程中加入了文本的主题信息,将主题信息和文本的词向量进行融合,能够尽可能获得文本主题特征,具有分类准确率高的优点。

著录项

  • 公开/公告号CN114036938A

    专利类型发明专利

  • 公开/公告日2022-02-11

    原文格式PDF

  • 申请/专利权人 华南师范大学;

    申请/专利号CN202110504328.7

  • 发明设计人 冼广铭;王鲁栋;李楚彬;张鑫;

    申请日2021-05-10

  • 分类号G06F40/289(20200101);G06F40/216(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44425 广州骏思知识产权代理有限公司;

  • 代理人吴静芝

  • 地址 528225 广东省佛山市南海区狮山南海软件园华南师范大学软件学院

  • 入库时间 2023-06-19 14:09:38

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-01

    实质审查的生效 IPC(主分类):G06F40/289 专利申请号:2021105043287 申请日:20210510

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号