首页> 中文学位 >基于粗糙集理论的文本分类方法研究
【6h】

基于粗糙集理论的文本分类方法研究

代理获取

目录

文摘

英文文摘

华南理工大学学位论文原创性声明及学位论文版权使用授权书

第一章绪论

1.1背景

1.2国内外研究概况

1.3课题来源和主要研究内容

1.4课题的意义

1.5论文内容安排

1.6本章小结

第二章相关的技术研究

2.1数据挖掘(Data minimg)技术

2.2知识获取技术的分类[10]

2.3 WEB挖掘(Web minimg)及其分类[5]

2.4文本分类和技术[8]

2.4.1基于概念的文献分类法

2.4.2 KNN分类法[2]

2.4.3贝页斯分类方法[2]

2.4.4基于语义网络的概念推理网分类方法[2]

2.4.5基于规则的文本分类技术

2.5文本挖掘中的特征提取及表示

2.5.1文本挖掘中的分词技术

2.5.2文本的特征提取

2.5.3文本的特征权重计算方法

2.5.4文本的向量空间表示

2.6本章小结

第三章粗造集

3.1 Rough Set

3.2通过粗糙集理论的知识发现[23]

3.3近似集的性质[9]

3.4可变精度Rough集模型

3.4.1 Rough隶属函数

3.4.2可变精度Rough集模型

3.4.3基于决策理论的Rough集

3.5数据集的约简

3.5.1决策表约简

3.5.2信息系统及其表示

3.5.3属性的可辩识矩阵简约[10]

3.6实值信息系统的离散化[31]

3.6.1决策表与决策属性支持度[9]

3.6.3基于支持度的连续属性离散化方法[31]

3.7值化简算法[23]

3.8默认规则

3.9有关基本粗糙集理论的KDD系统介绍[10]

3.9.1 LERS

3.9.2 ROSE

3.9.3 KDD-R

3.9.4 Rough Enough

3.9.5 Rosetta

3.10本章小结

第四章粗糙集理论在文本分类中的应用

4.1实验用到粗糙集理论的基本概念

4.1.1可分辨关系与决策表的定义[9]

4.1.2决策表的属性约简与规则的化简[9]

4.1.3属性的可辨识矩阵约简、值化简算法

4.1.4基于支持度连续属性离散化方法

4.2基于粗糙集的文本自动分类

4.2.1基于粗糙集的文本分类流程

4.2.2文本分类的主要技术处理

4.2.3特征项的权值计算与离散化

4.3实验结果的评估

4.4本章小结

结束语

参考文献

攻读学位期间已发表的学术论文

致谢

展开▼

摘要

随着科技和互联网技术的发展,人们可以获得的信息资源越来越多,这些信息资源散布于各种网站中.在网络这个庞大的虚拟图书馆中,占信息比重最大的文本数据却缺乏结构化、组织化的规整性,并且大大降低了网络文本信息的利用效率,所以运用文本自动分类技术将大大提高人们利用网络信息资源的效率.同时,信息数据量的爆炸性增长使得传统的手工处理方法变得不切合实际,因此需要采用自动化程度更高、效率更好的数据处理方法,帮助人们更高效地进行文本分类.而文本的自动分类技术则能降低网络的查询时间,提高网络搜索质量,方便网络用户,从而使快速有效地获取文本信息成为可能.该文主要介绍了几种基于文本的分类技术的原理和方法,以及对粗糙集理论在知识发现领域的应用作了一些的介绍.最后,该文提出了一种基于粗糙集理论的文本分类方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号