首页> 中文期刊> 《现代计算机:下半月版》 >基于加权词向量和LSTM-CNN的微博文本分类研究

基于加权词向量和LSTM-CNN的微博文本分类研究

         

摘要

近年来,随着网络技术的不断发展,微博作为一种社交工具越来越受到人们的喜爱。由此在微博上产生大量的包含个人情感的文本信息,而这些带有个人情感的文本信息对网络舆论的传播产生巨大影响,所以对微博文本的分析研究变得十分紧迫。针对于此,提出一种LSTM与CNN的混合模型对文本分类。首先,基于Word2Vec的词向量训练方法以克服传统文本向量表示方法中高维度和高稀疏性的问题;进一步,通过TF-IDF模型对词向量进行加权赋值以确定词向量的重要程度;最后,以加权运算后的词向量作为初始输入样本来对LSTM与CNN混合模型进行分类训练,进而自动提取出文本信息中的隐含特征,实现对微博评论数据的准确分类。实验结果表明,该方法能够显著提高对微博文本内容的分类准确率,进而有效预测微博舆论的传播趋势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号