首页> 中文学位 >基于样本密度的自训练方法及其在文本分类中的应用
【6h】

基于样本密度的自训练方法及其在文本分类中的应用

代理获取

目录

第一章 绪 论

1.1研究背景及研究意义

1.2研究现状

1.3研究内容

1.4文章结构

第二章 自训练方法

2.1机器学习

2.1.1 无监督学习

2.1.2监督学习

2.1.3半监督学习

2.2自训练方法

2.2.1自训练方法介绍

2.2.2基分类器

第三章 基于样本密度的自训练分类方法

3.1数据空间结构的确定

3.1.1基于数据密度的空间结构确定方法

3.1.2参数dc和ρ0的选取

3.2基于数据空间结构的自训练算法

3.3实验结果与分析

3.3.1实验设计

3.3.2实验结果

第四章 文本分类任务

4.1文本预处理

4.1.1中文分词

4.1.2过滤停用词

4.2文本向量表示

4.2.1词袋模型(Bag-of-words, BOW)

4.2.2词嵌入模型(Word Embedding)

4.3特征选择

第五章 改进的自训练方法在文本分类任务中的应用

5.1 实验设计

5.1.1实验数据

5.1.2实验过程

5.1.3评价标准

5.2实验结果

5.3参数讨论

5.3.1 初始有标记样本比例

5.3.2密度阈值和邻域阈值

结论

参考文献

攻读硕士学位期间发表论文

声明

致谢

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号