首页> 中文学位 >基于深度学习理论和SVM技术的文本分类研究与实现
【6h】

基于深度学习理论和SVM技术的文本分类研究与实现

代理获取

目录

声明

第1章 绪 论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文主要研究的工作

1.4 本文组织结构

第2章 文本分类相关技术概述

2.1 文本分类概述

2.2 文本预处理

2.3 文本的表示

2.4 特征选择

2.5 文本分类算法

2.6 本章小结

第3章 深度学习在文本分类中的关键技术应用

3.1 深度学习概述

3.2 深度学习的常用模型

3.3 稀疏自编码对文本训练

3.4 深度信念网络参数调优

3.5 本章小结

第4章 深度学习理论和SVM组合方法设计

4.1 深度学习与SVM组合方法设计

4.2 文本分类过程

4.3 本章小结

第5章 文本分类实验结果及分析

5.1 分类评估标准

5.2 实验数据集

5.3 实验环境

5.4 英文实验和中文实验

5.5 本章小结

第6章 总结与展望

6.1 研究工作总结

6.2 展望

参考文献

攻读硕士期间发表的学术论文

致谢

展开▼

摘要

随着互联网技术高速发展,产生海量的数据信息。每天都有数以百万计的网民通过互联网获取对自己有价值和意义的信息,如何能够让每一个人能快速、准确的从海量的数据中得到自己想要的知识、技能,已经成为当前研究的热点问题。要解决这类问题,研究者对数据进行获取分析、挖掘、归类,帮助人们提高信息检索的效率。本文主要核心的工作是:利用深度学习进行特征提取和支持向量机相结合的方法对海量数据文本进行挖掘分类和分析,最后得到文本的本质特征。
  传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集。如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷,针对这些问题,本文利用深度学习方法,结合现有的数据特点,提出将深度学习的两种方法和支持向量机方法进行结合设计分类器,完成文本分类,本文主要的研究内容和创新点如下:
  1.对国内外现有的文本分类技术的研究现状和研究意义进行了介绍,并且对文本分类重要性进行了阐述,最后指出了本论文要做的工作。
  2.首先研究了传统的分类技术,从文本预处理,文本特征提取和文本分类三部分充分研究,然后对贝叶斯,KNN,SVM分类算法进行阐述,并且对三种算法的适用范围和优缺点进行了分析。
  3.介绍深度学习的相关理论知识,提出了利用稀疏自动编码将原始数据进行高维空间映射,运用深度信念网络对稀疏自动编码的输出进行投影获取文本抽象特征。研究了深度学习中的稀疏自动编码和深度信念网络相结合进行文本特征提取的过程。
  4.本文结合深度学习和改进的多分类SVM方法,设计出由稀疏自动编码和深度信念网络,SVM分类相结合的分类器对文本进行分类。最后通过设计实验,对本文提出的方法进行测试,并与传统的文本分类方法进行了比较和分析。通过修改参数测试文本分类的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号