首页> 中文期刊>计算机研究与发展 >'天网'目录导航服务研究

'天网'目录导航服务研究

     

摘要

为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,研究了如何在Spider式搜索引擎"天网"系统中提供目录导航服务 .基本思想就是利用有指导的机器学习方法实现中文网页的自动分类 .主要贡献有两点:①搜集并建立了一个面向中文网页并且支持层次模型的大规模中文网页数据集,这是实现中文网页自动分类的前提和基础;②针对中文网页信息的自身特性以及CHI方法的固有缺陷,提出一种自动清除"噪音"的特征选取算法,并实现了一个能够处理海量中文网页的分类器 .实验结果表明该分类器有较高的分类质量,满足了搜索引擎目录导航服务的要求 .

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号