首页> 中文学位 >改进的TF-IDF特征选择和短文本分类算法研究
【6h】

改进的TF-IDF特征选择和短文本分类算法研究

代理获取

目录

声明

第一章 绪 论

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究现状

1.2.1 文本分类综述

1.2.2 国内外文本表示发展史概述

1.2.3 国内外文本分类发展史概述

1.3 论文的研究内容与组织结构

1.3.1 研究内容

1.3.2 论文组织结构

1.4 本章小结

第二章 短文本分类相关技术简介

2.1 文本规范化处理

2.1.1 文本预处理过程

2.1.2 中文分词方法

2.1.3 分词工具的介绍

2.2 文本特征选择与提取

2.2.1 文本特征表示

2.2.2 文本特征选择

2.3 文本分类算法

2.3.1 多项式朴素贝叶斯

2.3.2 支持向量机

2.3.3 逻辑回归算法

2.3.4 k 最近邻分类算法

2.3.5 卷积神经网络分类算法

2.4 分类算法评价指标

2.5 深度学习

2.6 Word2vec模型

2.6.1 CBOW 和Skip-Gram模型简介

2.6.2 Hierarchical Softmax 模型介绍

2.6.3 Negative Sampling 模型介绍

2.7 本章小结

第三章 改进的TF-IDF特征选择算法

3.1 改进型TF-IDF特征的权重算法

3.1.1 WF_TF-IDF

3.1.2 CHI_TF-IDF

3.1.3 WoTFI 特征选择模型

3.2 特征选择实验结果

3.2.1 实验数据

3.2.2 Word2vec参数配置

3.2.3 实验结果

3.3 基于WoTFI特征选择算法的CNN分类结果

3.3.1 神经网络语言模型

3.3.2 TextCNN文本分类算法模型

3.3.3 实验环境和分类模型参数配置

3.3.4 WoTFI 特征选择方法用于短文本分类结果

3.4 本章小结

第四章 基于Bi-LSTM 的char-CNN短文本分类模型的设计

4.1 字符级嵌入简述

4.2 本节模型介绍

4.2.1 引入双向长短时记忆网络算法的双通道卷积神经网络模型

4.2.2 解决过拟合的方法

4.2.3 LRN优化

4.2.4 LSTM模型介绍

4.2.5 Bi-LSTM模型介绍

4.3 中英文短文本实验数据

4.3.1 英文语料库处理

4.3.2 中文语料库处理

4.4 实验环境及模型参数配置

4.4.1 实验环境

4.4.2 模型参数设置

4.5 实验结果与分析

4.5.1 不同实验模型分类精度对比结果

4.5.2 嵌入方式不同的对比实验结果

4.6 本章小结

第五章 实验设计结果与分析

5.1 实验环境的介绍

5.2 文本数据模块的准备

5.3 实验结果与分析

5.3.1 维度对特征表示模型的影响

5.3.2 改进后的分类模型对SST-1数据分类的结果

5.3.4 融合的文本表示模型受单文本表示模型的影响

5.3.5分类结果验证

5.4 本章小结

总结与展望

参考文献

攻读学位期间发表的学术论文

致 谢

展开▼

著录项

  • 作者

    周欣;

  • 作者单位

    安徽大学;

  • 授予单位 安徽大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 朱军,柴立功;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号