首页> 中文学位 >基于样本密度的自训练方法及其在文本分类中的应用

【6h】

基于样本密度的自训练方法及其在文本分类中的应用

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

第一章绪论

1.1研究背景及研究意义

1.2研究现状

1.3研究内容

1.4文章结构

第二章自训练方法

2.1机器学习

2.1.1 无监督学习

2.1.2监督学习

2.1.3半监督学习

2.2自训练方法

2.2.1自训练方法介绍

2.2.2基分类器

第三章基于样本密度的自训练分类方法

3.1数据空间结构的确定

3.1.1基于数据密度的空间结构确定方法

3.1.2参数dc和ρ0的选取

3.2基于数据空间结构的自训练算法

3.3实验结果与分析

3.3.1实验设计

3.3.2实验结果

第四章文本分类任务

4.1文本预处理

4.1.1中文分词

4.1.2过滤停用词

4.2文本向量表示

4.2.1词袋模型(Bag-of-words, BOW)

4.2.2词嵌入模型(Word Embedding)

4.3特征选择

第五章改进的自训练方法在文本分类任务中的应用

5.1 实验设计

5.1.1实验数据

5.1.2实验过程

5.1.3评价标准

5.2实验结果

5.3参数讨论

5.3.1 初始有标记样本比例

5.3.2密度阈值和邻域阈值

结论

参考文献

攻读硕士学位期间发表论文

声明

致谢

展开▼

著录项

作者
艾震鹏;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科数学
授予学位硕士
导师姓名王振友;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
样本密度; 训练方法; 文本分类;
入库时间 2022-08-17 10:25:25

相似文献

中文文献
外文文献
专利

1. 基于样本密度加权的神经网络分类器在文本分类中的应用 [J] . 廖一星 . 计算机应用与软件 . 2009,第009期
2. 一种新的基于密度的k-最近邻文本分类器训练样本约减方法 [J] . 徐义峰 ,陈春明 ,徐云青 . 计算机系统应用 . 2007,第011期
3. 基于密度的kNN文本分类器训练样本裁剪方法 [J] . 李荣陆 ,胡运发 . 计算机研究与发展 . 2004,第004期
4. 文本分类中基于训练样本空间分布的K近邻改进算法 [J] . 刘海峰 ,刘守生 ,姚泽清 . 情报学报 . 2013,第001期
5. 文本分类中基于K-means的类偏斜KNN样本剪裁 [J] . 刘海峰 ,姚泽清 ,苏展 . 微电子学与计算机 . 2012,第5期
6. 小样本小波密度估计器及在过程监测中应用 [C] . 和平安 ,王海清 ,宋执环 . 2001中国控制与决策学术年会 . 2001
7. 基于邻域粗糙集的属性约简和样本约减算法研究及在文本分类中的应用 [A] . 梁海龙 . 2015

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号