基于加权词向量和LSTM-CNN的微博文本分类研究

马远浩; 曾卫明; 石玉虎; 徐鹏

首页> 中文期刊> 《现代计算机：下半月版》 >基于加权词向量和LSTM-CNN的微博文本分类研究

基于加权词向量和LSTM-CNN的微博文本分类研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,随着网络技术的不断发展,微博作为一种社交工具越来越受到人们的喜爱。由此在微博上产生大量的包含个人情感的文本信息,而这些带有个人情感的文本信息对网络舆论的传播产生巨大影响,所以对微博文本的分析研究变得十分紧迫。针对于此,提出一种LSTM与CNN的混合模型对文本分类。首先,基于Word2Vec的词向量训练方法以克服传统文本向量表示方法中高维度和高稀疏性的问题;进一步,通过TF-IDF模型对词向量进行加权赋值以确定词向量的重要程度;最后,以加权运算后的词向量作为初始输入样本来对LSTM与CNN混合模型进行分类训练,进而自动提取出文本信息中的隐含特征,实现对微博评论数据的准确分类。实验结果表明,该方法能够显著提高对微博文本内容的分类准确率,进而有效预测微博舆论的传播趋势。

著录项

来源
《现代计算机：下半月版》 |2018年第17期|18-22|共5页
作者
马远浩; 曾卫明; 石玉虎; 徐鹏;
展开▼
作者单位

上海海事大学信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类理论、方法;
关键词
文本挖掘; Word2Vec; 微博评论; 情感分析; LSTM; CNN;

相似文献

中文文献
外文文献
专利

1. 基于半监督与词向量加权的文本分类研究 [J] . 宋建国 . 软件导刊 . 2020,第009期
2. 基于加权词向量和卷积神经网络的新闻文本分类 [J] . 胡万亭 ,贾真 . 计算机系统应用 . 2020,第005期
3. 基于LSTM-CNN的中文短文本分类模型 [J] . 杜雪嫣 ,王秋实 ,王斌君 . 江苏警官学院学报 . 2020,第001期
4. 基于词向量的文本分类研究 [J] . 马力 ,李沙沙 . 计算机与数字工程 . 2019,第002期
5. 基于词向量特征扩展的中文短文本分类研究 [J] . 雷朔 ,刘旭敏 ,徐维祥 . 计算机应用与软件 . 2018,第008期
6. 基于词向量和主题向量嵌入的文本分类方法研究 [C] . Mao Wenliang ,毛文梁 ,Feng Dawei . 2017年全国高性能计算学术年会 . 2017
7. 基于深度学习与词向量的文本分类方法研究 [A] . 张宇艺 . 2019

基于加权词向量和LSTM-CNN的微博文本分类研究

摘要

著录项

相似文献

相关主题

期刊订阅