首页> 中文期刊>情报杂志 >基于主题模型的检索结果聚类应用研究

基于主题模型的检索结果聚类应用研究

     

摘要

[Purpose/Significance]Retrieval results clustering can help users to browse the retrieval results quickly.Traditional search results clustering based on vector space is lack of the deep semantic relations of the text, which leads to the poor readability and comprehension of clustering result.Therefore, the semantic level of retrieval results analysis and the research of semantic search results clustering have important theoretical and practical significance.[Method/Process]In this paper, the author combines LDA topic model and K-means.Firstly, we use LDA model to identify the latent semantic text.Secondly, we use the K-means clustering algorithm for clustering analysis of LDA results.Finally, we extract the description for the theme nearest to clustering center as the search result clustering label.[Result/Conclusion]Experiments show that this method has a good effect on the retrieval results clustering and clustering tag identification.%[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果.传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足.因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义.[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为K-means聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签.[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号