首页> 外文会议>Information Retrieval Technology >A No-Word-Segmentation Hierarchical Clustering Approach to Chinese Web Search Results
【24h】

A No-Word-Segmentation Hierarchical Clustering Approach to Chinese Web Search Results

机译:中文网页搜索结果的无词分割层次聚类方法

获取原文

摘要

In this paper, we present a No-Word-Segmentation Hierarchical Clustering Approach (NWSHCA) to Chinese Web search results. The approach uses a new similarity measure between two documents based on a variation of the Edit Distance, and then it generates preliminary clusters using a partitioning clustering method. Next it ranks all common substring in a cluster using a cluster-discriminative metric with the top K as cluster description labels. Finally it uses HAC to cluster the top K cluster labels to form a navigational tree. NWSHCA can generate overlapping clusters contrast to most clustering algorithms. Experimental results show that the approach is feasible and effective.
机译:在本文中,我们向中文搜索结果提出了一个无字分段分段分层聚类方法(nwshca)。该方法使用基于编辑距离的变型的两个文档之间的新相似度测量,然后使用分区聚类方法生成初步群集。接下来,它使用带有顶部K作为群集描述标签,在群集中排列群集中的所有公共子字符串。最后它使用HAC群集顶部K集群标签来形成导航树。 NWSHCA可以生成与大多数聚类算法对比的重叠群集。实验结果表明,该方法是可行和有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号