首页> 中文学位 >基于模糊—粗糙集的文本分类模型
【6h】

基于模糊—粗糙集的文本分类模型

代理获取

目录

摘要

Abstract

第一章引言

1.1研究背景

1.2本文的工作和论文的组织

第二章文本分类综述

2.1文本分类的基本概念

2.1.1文本分类的类型

2.1.2自动文本分类的过程

2.1.3文本分类的应用领域

2.2文本项的权重计算方法

2.3降维技术

2.3.1特征选择

2.3.2特征提取

2.4文本分类经典算法

2.4.1 Rocchio's算法

2.4.2朴素贝叶斯分类算法

2.4.3 k近邻分类算法

2.4.4决策树算法

2.4.5基于投票的算法

2.4.6支持向量机

第三章模糊集与粗糙集

3.1粗糙集理论

3.1.1知识的分类观点

3.1.2新型的隶属关系

3.1.3概念的边界观点

3.1.4知识约简

3.1.5粗糙集理论在分类上的应用

3.2模糊集

3.2.1模糊集合

3.2.2分解定理

3.2.3模糊关系

3.2.4模糊集理论在分类上的应用

第四章基于模糊粗糙集理论的文本分类模型

4.1概述

4.2模糊-粗糙集

4.3邻域空间

4.4不确定性的出现和处理

4.4.1模糊不确定性

4.4.2粗糙不确定性

4.5分类算法

第五章实验结果与分析

5.1 Reuters-21578语料说明

5.1.1文件格式

5.1.2文档内部标记

5.1.3类型

5.2预处理与特征选择

5.3实验结果的评估指标和评估方法

5.3.1评估指标

5.3.2评估方法

5.4实验的步骤以及参数的选择

5.5实验

5.5.1参照方法简介

5.5.2实验分析

第六章总结与展望

6.1本文总结

6.2将来的工作

参考文献

论文与工作

致谢

独创性声明和论文使用授权说明

展开▼

摘要

如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务.文本自动分类是实现这个任务的重要方法之一.在文本分类过程中,由于同义词、多义词、近义词的存在导致许多类并不能完全划分开来,造成类之间的边界模糊.此外交叉学科的发展,使得类之间出现重叠,于是造成许多文本信息并非绝对属于某个类.这两种情况均会导致分类有偏差.针对上述情形,本文提出利用粗糙-模糊集理论来处理在文本分类问题中出现的这些偏差.模糊-粗糙集理论有机的结合了模糊集理论与粗糙集理论在处理不确定信息方面的能力.粗糙集理论体现了由于属性不足引起集合中对象间的不可区分性,即由于知识的粒度而导致的粗糙性;而模糊集理论则对集合中子类边界的不清晰定义进行了模型化,反映了由于类别之间的重叠体现出的隶属边界的模糊性.它们处理的是两种不同类别的模糊和不确定性.将两者结合起来的模糊-粗糙集理论能更好地处理不完全知识.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号