用于文本分类的局部化双向长短时记忆

万圣贤; 兰艳艳; 郭嘉丰; 徐君; 庞亮; 程学旗

首页> 中文期刊> 《中文信息学报》 >用于文本分类的局部化双向长短时记忆

用于文本分类的局部化双向长短时记忆

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,深度学习越来越广泛地应用于自然语言处理领域,人们提出了诸如循环神经网络(RNN)等模型来构建文本表达并解决文本分类等任务.长短时记忆(long short term memory,LSTM)是一种具有特别神经元结构的RNN.LSTM的输入是句子的单词序列,模型对单词序列进行扫描并最终得到整个句子的表达.然而,常用的做法是只把LSTM在扫描完整个句子时得到的表达输入到分类器中,而忽略了扫描过程中生成的中间表达.这种做法不能高效地提取一些局部的文本特征,而这些特征往往对决定文档的类别非常重要.为了解决这个问题,该文提出局部化双向LSTM模型,包括MaxBiLSTM和ConvBiLSTM.MaxBiLSTM直接对双向LSTM的中间表达进行max pooling.ConvBiLSTM对双向LSTM的中间表达先卷积再进行max pooling.在两个公开的文本分类数据集上进行了实验.结果表明,局部化双向LSTM尤其是ConvBiLSTM相对于LSTM有明显的效果提升,并取得了目前的最优结果.%Deep learning has shown great benefits for natural language processing in recent years.Models such as Recurrent Neural Networks (RNNs) have been proposed to extract text representation,which can be applied for text classification.Long short term memory (LSTM) is an advanced kind of RNN with special neural cells.LSTM accepts a sequence of words from a sentence scans over the whole sequence and outputs the representation of the sentence.However,customary practices use only the last representation LSTM produced for classification,ignoring all other intermediate representations.A clear drawback is that it could not capture efficiently local features that are very important for determining the sentence's class label.In this paper,we propose the local bidirectional long short term memory to deal with this problem,including MaxBiLSTM and ConvBiLSTM.MaxBiLSTM conducts a max pooling operation and ConvBiLSTM conducts a convolution operation followed with a max pooling operation on all intermediate representations generated by bidirectional LSTM.Experimental results on two public datasets for text classification show that local bidirectional LSTM,especially ConvBiLSTM,outperforms bidirectional LSTM consistently and reaches the state-of-the-art performances.

著录项

来源
《中文信息学报》 |2017年第3期|62-68|共7页
作者
万圣贤; 兰艳艳; 郭嘉丰; 徐君; 庞亮; 程学旗;
展开▼
作者单位

中国科学院计算技术研究所,北京100190;

中国科学院大学,北京100190;

中国科学院计算技术研究所,北京100190;

中国科学院计算技术研究所,北京100190;

中国科学院计算技术研究所,北京100190;

中国科学院计算技术研究所,北京100190;

中国科学院大学,北京100190;

中国科学院计算技术研究所,北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本分类; 深度学习; 长短时记忆; 卷积;

相似文献

中文文献
外文文献
专利

1. 基于双通道双向长短时记忆网络的铁路行车事故文本分类 [J] . 韩广 ,卜桐 ,王明明 . 铁道学报 . 2021,第009期
2. 基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法 [J] . 孟先艳 ,崔荣一 ,赵亚慧 . 计算机应用研究 . 2020,第009期
3. 基于Word2Vec词嵌入和双向长短时记忆网络的文本分类实现 [J] . 王玲 . 电子技术与软件工程 . 2020,第015期
4. 基于多层双向长短时记忆网络的装甲车辆柴油机喷油器故障诊断 [J] . 靳莹 ,乔新勇 . 兵工自动化 . 2022,第1期
5. 融合注意力机制与双向长短时记忆网络的基于语音分析的抑郁识别方法 [J] . 赵张 ,汪静莹 ,耿馨佚 . 复旦学报:自然科学版 . 2021,第6期
6. 双向调堵技术在G271长X油藏的应用 [C] . 刘杰 ,贾彬红 ,刘永涛 . 第十三届宁夏青年科学家论坛石化专题论坛 . 2017
7. 基于长短时记忆网络的多标签文本分类 [A] . 熊涛 . 2017

用于文本分类的局部化双向长短时记忆

摘要

著录项

相似文献

相关主题

期刊订阅