[目的]随着信息技术和互联网的快速发展,微博等短文舆情的研究对网络舆情的研究十分重要,针对中文短文本信息量小、特征稀疏的特点,研究了微博短文本的情感分类,本文旨在提高微博短文本的特征提取能力以便于对网络舆情进行预测.[方法]为了更好地提取微博短文本的情感特征,本文首先利用BERT(Bidirectional Encoder Representation from Transformers)模型实现文本向量化,再利用卷积神经网络CNN(Convolution Neural Network)进行文本局部语义特征提取,最后将局部语义特征向量和B E RT训练的特征向量进行特征融合.该方法有效地解决了短文本特征提取难的特点.[结果]实验结果表明,将该方法提取的文本向量带入到LSTM文本分类模型中,本文模型的分类准确率比BiLSTM+CNN+Attenion模型高出1.24%,比BiLSTM+Attenion模型高出3.22%,比LSTM+Attenion模型高出5.24%,比Text-CNN模型高出6.46%,比SVM高出8.47%.[结论]所提特征融合模型有效提升了文本情感分类的准确率.
展开▼