首页> 外文会议>5th Asia-Pacific Web Conference on Web Technologies and Applications APWeb 2003 Apr 23-25, 2003 Xian, China >Web Page Clustering: A Hyperlink-Based Similarity and Matrix-Based Hierarchical Algorithms
【24h】

Web Page Clustering: A Hyperlink-Based Similarity and Matrix-Based Hierarchical Algorithms

机译:网页聚类:基于超链接的相似性和基于矩阵的分层算法

获取原文
获取原文并翻译 | 示例

摘要

This paper proposes a hyperlink-based web page similarity measurement and two matrix-based hierarchical web page clustering algorithms. The web page similarity measurement incorporates hyperlink transitivity and page importance within the concerned web page space. One clustering algorithm takes cluster overlapping into account, another one does not. These algorithms do not require predefined similarity thresholds for clustering, and are independent of the page order. The primary evaluations show the effectiveness of the proposed algorithms in clustering improvement.
机译:提出了一种基于超链接的网页相似度度量和两种基于矩阵的分层网页聚类算法。网页相似性度量在相关网页空间内合并了超链接的传递性和页面重要性。一种聚类算法将聚类重叠考虑在内,另一种则不考虑。这些算法不需要用于聚类的预定义相似性阈值,并且与页面顺序无关。初步评估显示了所提出算法在聚类改进中的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号