文摘
英文文摘
华南理工大学学位论文原创性声明及学位论文版权使用授权书
第一章绪论
1.1背景
1.2国内外研究概况
1.3课题来源和主要研究内容
1.4课题的意义
1.5论文内容安排
1.6本章小结
第二章相关的技术研究
2.1数据挖掘(Data minimg)技术
2.2知识获取技术的分类[10]
2.3 WEB挖掘(Web minimg)及其分类[5]
2.4文本分类和技术[8]
2.4.1基于概念的文献分类法
2.4.2 KNN分类法[2]
2.4.3贝页斯分类方法[2]
2.4.4基于语义网络的概念推理网分类方法[2]
2.4.5基于规则的文本分类技术
2.5文本挖掘中的特征提取及表示
2.5.1文本挖掘中的分词技术
2.5.2文本的特征提取
2.5.3文本的特征权重计算方法
2.5.4文本的向量空间表示
2.6本章小结
第三章粗造集
3.1 Rough Set
3.2通过粗糙集理论的知识发现[23]
3.3近似集的性质[9]
3.4可变精度Rough集模型
3.4.1 Rough隶属函数
3.4.2可变精度Rough集模型
3.4.3基于决策理论的Rough集
3.5数据集的约简
3.5.1决策表约简
3.5.2信息系统及其表示
3.5.3属性的可辩识矩阵简约[10]
3.6实值信息系统的离散化[31]
3.6.1决策表与决策属性支持度[9]
3.6.3基于支持度的连续属性离散化方法[31]
3.7值化简算法[23]
3.8默认规则
3.9有关基本粗糙集理论的KDD系统介绍[10]
3.9.1 LERS
3.9.2 ROSE
3.9.3 KDD-R
3.9.4 Rough Enough
3.9.5 Rosetta
3.10本章小结
第四章粗糙集理论在文本分类中的应用
4.1实验用到粗糙集理论的基本概念
4.1.1可分辨关系与决策表的定义[9]
4.1.2决策表的属性约简与规则的化简[9]
4.1.3属性的可辨识矩阵约简、值化简算法
4.1.4基于支持度连续属性离散化方法
4.2基于粗糙集的文本自动分类
4.2.1基于粗糙集的文本分类流程
4.2.2文本分类的主要技术处理
4.2.3特征项的权值计算与离散化
4.3实验结果的评估
4.4本章小结
结束语
参考文献
攻读学位期间已发表的学术论文
致谢