首页> 中国专利> 基于正能量词典正能量新闻分类方法

基于正能量词典正能量新闻分类方法

摘要

本发明公开了一种基于正能量词典正能量新闻分类方法,包括以下步骤:步骤1,使用正能量新闻语料,进行分词处理去掉停用词,采用tfidf算法获取正能量新闻语料的关键词词汇,人工从关键词词汇中筛选正能量关键词,构建初步的正能量词典;步骤2,使用word2vec算法,将正能量新闻语料词向量化,对初步的正能量词典的每个正能量关键词获取与其相近和共同出现的词汇,再通过同义词方式查找每个词汇的多个同义词扩建正能量词典;步骤3,通过albert获取新闻语料的特征词向量,采用深度学习textcnn+attention模型,处理得到深度学习的隐藏层。本发明的有益之处在于,相比传统的识别方法对新闻正能量文本识别的准确率高。

著录项

  • 公开/公告号CN111813937A

    专利类型发明专利

  • 公开/公告日2020-10-23

    原文格式PDF

  • 申请/专利权人 新华智云科技有限公司;

    申请/专利号CN202010645896.4

  • 发明设计人 刘品呈;

    申请日2020-07-07

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/247(20200101);G06F40/284(20200101);

  • 代理机构33289 杭州裕阳联合专利代理有限公司;

  • 代理人姚宇吉

  • 地址 310012 浙江省杭州市西湖区文一西路460号文娱中心430室

  • 入库时间 2023-06-19 08:38:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号