基于改进LSTM单元的循环神经网络中文分词研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

中文分词作为中文自然语言处理的基础任务，是信息抽取、文本挖掘、信息检索等领域不可替代的预处理方法。随着人工智能技术的飞速发展，循环神经网络在语音识别、机器翻译等序列任务中表现突出，尤其是基于长短期记忆（Long Short-Term Memory,LSTM）单元的循环神经网络在各个领域都取得巨大成就，在中文分词任务中也取得媲美传统统计方法的成绩。但是，在单向单层网络的基础上搭建双向多层网络的试验表明，基础模型的精度并没有随模型复杂度的提升而进一步明显升高。而LSTM单元自身复杂的结构却成为研究和使用的瓶颈，训练与预测均要消耗大量的时间，简化基础模型已成为当务之急。论文在研究深度学习基础理论与LSTM单元结构的基础上，结合现有文献对循环神经网络及其单元结构的理论研究，经过试验，提出一个新的LSTM单元简化变种。该变种结构极为简单，并且仅包含一个门结构，区别于同样只包含一个门的最少门单元（Minimal Gated Unit，MGU），论文称该结构为简化门单元（Simplified Minimal Gated Unit，SMGU）。与之前的变种相比，SMGU使用与MGU完全不同的思路将LSTM中的3个门减少到1个，对隐藏状态的更新过程也极为简单。同时，SMGU在隐藏状态更新的过程中，完全去除隐藏状态对自身的影响。这也是SMGU区别于LSTM及其变体最大的一点。简单的计算过程使得SMGU单元的极限参数量不超过同等输入LSTM模型的1/2，实际中则更少。理论上模型越简单，越易于分析，在包含门结构的循环神经网络理论研究中，SMGU单元是保持各方面优点的最简结构。使用SMGU搭建循环神经网络进行实验表明：在得到与LSTM网络同等精度的情况下，SMGU的训练时间仅为LSTM的一半，推理预测速度更是达到其3倍。对比GRU和MGU的结果也表明，在如中文分词的序列任务中，更新隐藏状态不适合使用隐藏状态自身作为输入。

著录项

作者
孙严伟;
展开▼
作者单位

南华大学;

展开▼
授予单位南华大学;
学科计算机科学与技术
授予学位硕士
导师姓名刘志明;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术 ; 自动化技术及设备 ;
关键词
改进; 单元; 循环神经网络;

相似文献

中文文献
外文文献
专利

1. 基于改进的多层BLSTM的中文分词和标点预测 [J] . 李雅昆 ,潘晴 ,Everett X.WANG . 计算机应用 . 2018 ,第005期
2. 基于循环神经网络序列标注的中文分词研究 [J] . 刁琦 ,古丽米拉·克孜尔别克 ,钟丽峰 . 计算机技术与发展 . 2017 ,第010期
3. 基于LSTM循环神经网络的盐城汽车试验场气温预测模型研究 [J] . 陈宏伟 ,于群 ,崔晓川 . 汽车工程师 . 2021 ,第003期
4. 基于LSTM循环神经网络的盐城汽车试验场气温预测模型研究 [J] . 陈宏伟 ,于群 ,崔晓川 . 汽车工程师 . 2021 ,第003期
5. 基于CAS优化的LSTM循环神经网络的高压断路器故障预测方法研究 [J] . 张莲 ,王磊 ,曹阳 . 重庆理工大学学报 . 2020 ,第002期
6. 基于Lattice-LSTM的多粒度中文分词 [C] . ZHANG Wenjing ,张文静 ,ZHANG Huimeng . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于改进LSTM循环神经网络瓦斯数据时间序列预测研究 [A] . 刘剑桥 . 2018

基于改进LSTM单元的循环神经网络中文分词研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅