首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于特征短语的网页在线聚类方法

基于特征短语的网页在线聚类方法

摘要

随着互联网的迅速发展,越来越多的人通过搜索引擎来获取想要得到的信息.但是搜索引擎返回的结果成百上千,如何从中发现所需的信息就成了一个特别现实的问题.通过对查询结果进行在线聚类就可以解决这个问题,网页聚类能帮助用户快速准确地定位信息.但对聚类算法的复杂度有严格限制,许多传统的聚类算法并适合网页在线聚类.为此,本文提出了一种基于特征短语的快速网页在线聚类算法,该方法利用后缀数组提取网页特征短语,在此基础上进行快速聚类以及类别标注,提供清晰、易于理解的类别内容概括,并对聚类结果进行了类间以及类内排序.最后,通过实验验证了该在线聚类算法类别标注的可读性、算法效率以及聚类准确性等方面的有效性,并指出了未来研究工作的重点.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号