声明
致谢
摘要
缩略词表
1.1研究背景及意义
1.2国内外研究现状
1.2.1词、句表示研究现状
1.2.2文本分类研究现状
1.2.3迁移学习研究现状
1.3本论文的主要研究内容
1.4本论文的主要贡献
1.5本论文的组织结构
2技术背景
2.1词表示方法
2.1.1基于神经网络的词表示
2.2机器学习
2.2.1机器学习中的分类问题
2.2.2分类问题性能评价标准
2.2.3预处理与特征工程
2.2.4逻辑回归算法
2.2.5 k近邻算法
2.3深度学习
2.3.1前馈神经网络
2.3.1卷积神经网络(CNN)
2.3.2循环神经网络(RNN)
2.3.3自编码器(AutoEncoder)
2.4开发平台
2.4.2 Tensorflow与Keras开源软件库
2.5本章小结
3词向量无监督二次优化研究
3.1研究问题阐述
3.2数据集
3.2.1数据集介绍
3.2.2数据集预处理
3.3 word2vec词向量训练
3.3.1词向量训练方法
3.3.2训练设置及结果分析
3.4词向量二次训练优化方法
3.4.1词向量无监督优化模型
3.4.2评价指标
3.4.3自编码二次训练效果分析
3.5本章小结
4结合中文字形的词向量扩展研究
4.1问题描述
4.2中文字词特性分析
4.3数据集介绍及预处理
4.3.1数据集及问题介绍
4.3.2数据集处理
4.4字形特征提取
4.4.1字形结构特征
4.4.2词向量特征扩展
4.5字形特征在文本分类中的应用
4.5.1文本分类模型
4.5.2 Add方式分类实验
4.5.3 kNN方式分类实验
4.6本章小结
5总结及展望
5.1本文工作总结
5.1.1无监督二次训练研究
5.1.2中文字形特征研究
5.2未来工作展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果