首页> 中文学位 >非负矩阵分散及其在模糊网页分类中的应用
【6h】

非负矩阵分散及其在模糊网页分类中的应用

代理获取

摘要

当前基于统计词频等对网页及其文本进行分类的方法很少考虑语义模糊词的分类问题,因而当文本中存在大量语义模糊的词时,分类的效果并不理想,因此本文引入模糊推理来解决上述问题。此外,本文所涉及到的数据都是一些大规模的文本数据,论文中将一个大规模的文本数据抽象为一个高维矩阵VSM,而直接处理高维数据势必会很繁琐,试想如果将高维矩阵简化为一个低维矩阵,问题会变得简单许多。而非负矩阵分解算法是一种对高维矩阵进行降维的方法,具有实现简单、可解释性强等优点,从而可以把NMF算法应用到矩阵降维中。基于文本分类的不足及NMF在矩阵降维上的优点,本文提出了一种基于非负矩阵分解的模糊网页分类算法。该算法通过非负矩阵分解对一个大规模的词-文本矩阵进行维数约减,实现对数据的压缩,以提高算法执行效率,最后的分类阶段本文加入模糊推理来设计分类器。通过对随机抽取的网页数据进行分类实验,并与没有经过模糊处理阶段设计的分类器进行比较,实验结果表明本文算法的分类精度较高;执行效率方面本文与奇异值分解(SVD)做了对比实验。基于以上的内容,本文的主要工作如下。
   对当前网页分类的产生、发展过程做了详细的分析,总结了当前网页分类的主要步骤及方法。根据文本和网页的共同点是两者都存在文本,所以将文本分类的方法应用于网页分类,并且在网页文本分类中过程中引入了模糊推理规则。
   实验结果表明在分类过程中引入模糊推理将大大的提高了分类的精度;并且与传统的奇异值分解(SVD)方法相比,在执行效率方面也有很大的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号