首页> 外文期刊>ACM Computing Surveys >Web Page Classification: Features and Algorithms
【24h】

Web Page Classification: Features and Algorithms

机译:网页分类:功能和算法

获取原文
获取原文并翻译 | 示例
           

摘要

Classification of Web page content is essential to many tasks in Web information retrieval such as maintaining Web directories and focused crawling. The uncontrolled nature of Web content presents additional challenges to Web page classification as compared to traditional text classification, but the interconnected nature of hypertext also provides features that can assist the process.rnAs we review work in Web page classification, we note the importance of these Web-specific features and algorithms, describe state-of-the-art practices, and track the underlying assumptions behind the use of information from neighboring pages.
机译:网页内容的分类对于Web信息检索中的许多任务(例如维护Web目录和集中爬网)至关重要。与传统的文本分类相比,Web内容的不受控制的性质给网页分类带来了其他挑战,但是超文本的互连性质也提供了可以辅助该过程的功能。当我们回顾网页分类的工作时,我们注意到这些内容的重要性特定于Web的功能和算法,描述了最新的实践,并跟踪了使用相邻页面信息背后的基本假设。

著录项

  • 来源
    《ACM Computing Surveys》 |2009年第2期|215-245|共31页
  • 作者

    XIAOGUANG Ql; BRIAN D. DAVISON;

  • 作者单位

    Department of Computer Science & Engineering, Lehigh University, Bethlehem, PA 18015;

    Department of Computer Science & Engineering, Lehigh University, Bethlehem, PA 18015;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    categorization; web mining;

    机译:分类网络挖掘;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号