基于深度学习理论和SVM技术的文本分类研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网技术高速发展，产生海量的数据信息。每天都有数以百万计的网民通过互联网获取对自己有价值和意义的信息，如何能够让每一个人能快速、准确的从海量的数据中得到自己想要的知识、技能，已经成为当前研究的热点问题。要解决这类问题，研究者对数据进行获取分析、挖掘、归类，帮助人们提高信息检索的效率。本文主要核心的工作是：利用深度学习进行特征提取和支持向量机相结合的方法对海量数据文本进行挖掘分类和分析，最后得到文本的本质特征。
　　传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法，通过设置阈值获取特征集。如果训练集的数据量较大，则容易出现特征项不明确、特征信息丢失等缺陷，针对这些问题，本文利用深度学习方法，结合现有的数据特点，提出将深度学习的两种方法和支持向量机方法进行结合设计分类器，完成文本分类，本文主要的研究内容和创新点如下：
　　1．对国内外现有的文本分类技术的研究现状和研究意义进行了介绍，并且对文本分类重要性进行了阐述，最后指出了本论文要做的工作。
　　2．首先研究了传统的分类技术，从文本预处理，文本特征提取和文本分类三部分充分研究，然后对贝叶斯，KNN，SVM分类算法进行阐述，并且对三种算法的适用范围和优缺点进行了分析。
　　3．介绍深度学习的相关理论知识，提出了利用稀疏自动编码将原始数据进行高维空间映射，运用深度信念网络对稀疏自动编码的输出进行投影获取文本抽象特征。研究了深度学习中的稀疏自动编码和深度信念网络相结合进行文本特征提取的过程。
　　4．本文结合深度学习和改进的多分类SVM方法，设计出由稀疏自动编码和深度信念网络，SVM分类相结合的分类器对文本进行分类。最后通过设计实验，对本文提出的方法进行测试，并与传统的文本分类方法进行了比较和分析。通过修改参数测试文本分类的准确率。

著录项

作者
刘国锋;
展开▼
作者单位

江苏科技大学;

展开▼
授予单位江苏科技大学;
学科电子与通信工程
授予学位硕士
导师姓名吴陈;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
深度学习; 支持向量机; 文本分类; 稀疏自动编码; 特征提取;

相似文献

中文文献
外文文献
专利

1. 基于SVM藏文文本分类的研究与实现 [J] . 贾宏云 ,群诺 ,苏慧婧 . 电子技术与软件工程 . 2018,第009期
2. 基于SVM主动学习技术的 PU 文本分类 [J] . 富震 . 计算技术与自动化 . 2014,第001期
3. 基于SVM算法的文本分类技术研究 [J] . 崔建明 ,刘建明 ,廖周宇 . 计算机仿真 . 2013,第002期
4. 基于SVM技术的文本分类研究 [J] . 祝磊 . 软件导刊 . 2006,第012期
5. 基于SVM的中文文本分类反馈学习技术的研究 [J] . 孙晋文 ,肖建国 . 控制与决策 . 2004,第8期
6. 基于SVM主动学习技术的PU文本分类 [C] . 张长利 ,左万利 ,彭涛 . 2007中国计算机大会 . 2007
7. 基于深度学习理论的中文文本分类技术研究 [A] . 赖文辉 . 2019

基于深度学习理论和SVM技术的文本分类研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅