首页> 中文会议>第一届全国信息检索与内容安全学术会议 >基于粗糙集的文本分类方法研究

基于粗糙集的文本分类方法研究

摘要

本文旨在利用粗糙集优越的约简理论对文本进行分类.主要完成了以下几个方面的任务:对文本进行了预处理,包括分词、词性标注、停用词的过滤以及同义词的处理;改进了Okapi权重计算公式,综合考虑了位置、词频、文本长度、反文档频率等因素,并对权值进行了离散化;实现了属性约简和规则抽取,首先利用区分矩阵对特征向量维数进行了初次压缩,然后通过相对约简计算再次压缩了特征向量维数,并生成了决策规则;采取了规则合成的策略,生成最终的决策规则;设计了一种文本与规则的匹配算法,使匹配过程尽可能简单有序.试验结果表明该方法是行之有效的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号