首页> 中文期刊>微型机与应用 >基于Dirichlet过程的Deep Web数据源聚类方法

基于Dirichlet过程的Deep Web数据源聚类方法

     

摘要

提出了一种基于Dirichlet过程的Deep Web数据源聚类方法,该方法采用层次Dirichlet过程(HDP)进行特征提取.首先将查询接口中原本高维稀疏的文本表示为主题特征,该过程能自动确定特征数.然后将文本看成多项式模型,采用Dirichlet过程混合模型聚类.该模型无需人工事先指定聚类个数,由Dirichlet过程根据数据自动计算得到,特别适用于Deep Web数据源数量大、变化快的特点.在通用数据集TEL-8上进行验证实验,并与其他聚类方法在F-measure和熵值两个指标上进行对比,均取得较好的结果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号