【24h】

Research on User-Oriented Short Text Clustering

机译:面向用户的短文本聚类研究

获取原文

摘要

To solve the problem of weak semantic description ability of short text feature and feature sparse of short text, this paper proposes a user-orientedshort text clustering method. In the pre-process, this method uses semantic-independent word dictionary to identify and remove semantic-independent word, and then uses semantics class dictionary to normalize semantics. In addition, this paper proposes position same meta similarity calculation method based on k-gram and proceeds hierarchical clustering on short texts finally. Results of experiment show that thealgorithm proposed by this paper can improve the effect of short text clustering.
机译:针对短文本特征语义描述能力弱,短文本特征稀疏的问题,提出了一种面向用户的短文本聚类方法。在预处理过程中,该方法使用与语义无关的单词字典来识别和删除与语义无关的单词,然后使用语义类字典对语义进行规范化。此外,本文提出了一种基于k-gram的位置相同元相似度计算方法,并最终对短文本进行了层次聚类。实验结果表明,本文提出的算法可以提高短文本聚类的效果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号