首页> 中文期刊>软件导刊 >基于领域向量模型的新闻网页分类算法

基于领域向量模型的新闻网页分类算法

     

摘要

随着互联网中网页数量的激增,网页自动分类已经成为互联网技术中亟待解决的问题.提出一种领域向量模型的设计与构建方法,设计并实现一种针对新闻网页的基于领域向量模型的网页分类TSC(Topic Sensitive Classify)算法,从新的角度解决网页自动分类问题.首先,对大量的新闻网页URL进行分析,提取新闻网页的URL特征;然后,设计一个领域向量模型,对特定领域的新闻网页内容特征进行提取;最后,结合新闻网页URL特征和内容特征对新闻网页进行自动分类.实验结果表明,TSC算法分类效果比传统SVM和ID3等文本分类算法更优.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号