基于混合神经网络模型的中文文本分类研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，深度学习理论被广泛应用在各个领域之中，在机器翻译、语音识别、计算机视觉等领域都有着优秀表现。现如今的信息时代充斥着非结构化的文本信息，每天产生的文本数据呈现出指数级增长。这些文本数据呈现出大量性、多样性和低价值密度性。如何从这些文本数据中提取出有价值的信息，是人工智能领域的一个备受关注的研究方向。　　本文在深入了解文本分类的现状和相关理论知识之后，以文本分类作为研究问题，将深度学习模型应用于文本分类领域之中。为了进一步提高模型分类精度和解决文本表示稀疏性的问题，本文提出了一种基于卷积神经网络（CNN）和长短时记忆网络（LSTM）的混合神经网络模型，同时对词嵌入层进行了改进，深化了主题词权重的同时，还能够提取文本中的局部特征和上下文语义信息。本文的主要工作内容和创新点如下：　　本文首先简要介绍了自然语言处理和深度学习理论的相关研究现状，分析了自然语言处理技术研究的重要性。并对文本分类任务的一般流程和有关算法做了充分的介绍。　　其次为了进一步提高主题词的权重值，在词嵌入层的生成中引入TF-IDF值，TF-IDF值能够衡量词语对于一类文档的特殊性，强调类别中的高频特征词。将由word2vec生成的词向量与TF-IDF值加权形成词嵌入层。为了提高文本分类的精确性，将卷积神经网络（CNN）和长短时记忆网络（LSTM）相结合进行文本特征提取，综合两种模型的特征提取性能，不仅能够提取文本局部特征，还能够捕捉到上下文语义信息，同时加入了dropout随机失活策略，提高了模型的抗过拟合能力。　　最后通过在中文文本数据集上进行文本分类任务，将前述改进相结合，实现了完整的文本分类系统架构并进行实验。综合对比了传统的机器学习方法如支持向量机（SVM）、朴素贝叶斯、卷积神经网络模型（CNN）模型以及本文所提出的改进的混合神经网络模型对比，从精确率、召回率和F1值上都验证了改进的混合神经模型确实具有更好的分类效果。

著录项

作者
史培蓓;
展开▼
作者单位

西南财经大学;

展开▼
授予单位西南财经大学;
学科应用统计
授予学位硕士
导师姓名张华节;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
中文文本分类,混合神经网络,特征提取,随机失活策略,支持向量机,朴素贝叶斯;

相似文献

中文文献
外文文献
专利

1. 基于VDCNN与LSTM混合模型的中文文本分类研究 [J] . 彭玉青 ,宋初柏 ,闫倩 . 计算机工程 . 2018,第011期
2. 基于混合特征的中文文本分类 [J] . 罗永莲 ,张永奎 . 电脑开发与应用 . 2005,第004期
3. 基于MLP和SepCNN神经网络模型的藏文文本分类研究 [J] . 苏慧婧 ,索朗拉姆 ,尼玛扎西 . 软件 . 2020,第012期
4. 基于神经网络模型的文本分类研究综述 [J] . 孙嘉琪 ,王晓晔 ,周晓雯 . 天津理工大学学报 . 2019,第005期
5. 基于TextRank和LDA的中文短文本分类研究 [J] . 张兵磊 . 信息与电脑 . 2021,第006期
6. 基于字特征的中文文本分类技术研究 [C] . 张煜斌 ,陆建峰 ,杨静宇 . 2009年全国模式识别学术会议暨首届中日韩模式识别学术研讨会 . 2009
7. 基于混合神经网络模型的中文文本分类研究 [A] . 史培蓓 . 2020

基于混合神经网络模型的中文文本分类研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅