第一章 绪 论
1.1研究背景及研究意义
1.2研究现状
1.3研究内容
1.4文章结构
第二章 自训练方法
2.1机器学习
2.1.1 无监督学习
2.1.2监督学习
2.1.3半监督学习
2.2自训练方法
2.2.1自训练方法介绍
2.2.2基分类器
第三章 基于样本密度的自训练分类方法
3.1数据空间结构的确定
3.1.1基于数据密度的空间结构确定方法
3.1.2参数dc和ρ0的选取
3.2基于数据空间结构的自训练算法
3.3实验结果与分析
3.3.1实验设计
3.3.2实验结果
第四章 文本分类任务
4.1文本预处理
4.1.1中文分词
4.1.2过滤停用词
4.2文本向量表示
4.2.1词袋模型(Bag-of-words, BOW)
4.2.2词嵌入模型(Word Embedding)
4.3特征选择
第五章 改进的自训练方法在文本分类任务中的应用
5.1 实验设计
5.1.1实验数据
5.1.2实验过程
5.1.3评价标准
5.2实验结果
5.3参数讨论
5.3.1 初始有标记样本比例
5.3.2密度阈值和邻域阈值
结论
参考文献
攻读硕士学位期间发表论文
声明
致谢
广东工业大学;