首页> 中文期刊> 《数码世界 》 >分类加权的TF-IDF的网页分类算法

分类加权的TF-IDF的网页分类算法

         

摘要

网页分类算法是目前比较热门的研究课题,目前已经有许多网页分类算法,其中TFIDF算法是一种用于信息检索与数据挖掘的常用加权技术,本文通过TFIDF算法提取了每个分类下的具有高区分度的特征词,在网页分类时通过找出其中最能代表该网页的词素,依据该词素的类别信息即能对网页进行分类。由于TFIDF算法中词频计算未考虑网页结构信息,因此在本文中对词频计算进行了改进,通过对网页结构分类,计算词素出现在不同分类下的权重,达到对网页信息的合理利用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号