首页> 外文会议>International Conference on Data and Software Engineering >Using dictionary in a knowledge based algorithm for clustering short texts in Bahasa Indonesia
【24h】

Using dictionary in a knowledge based algorithm for clustering short texts in Bahasa Indonesia

机译:在基于知识的算法中使用字典对印度尼西亚语中的短文本进行聚类

获取原文

摘要

Text clustering is important in many application of information retrieval. This paper presents a study of clustering short texts in Bahasa Indonesia using semantic similarity approach where dictionary of synonyms and hyponyms is used to get information on word relatedness. We compare sentence similarity calculations based on lexical matching and word similarity. More than 250 sentences are involved. Our experiment shows that clustering using sentence similarity based on lexical matching performs better in terms of precision and F-measure than clustering using sentence similarity based on semantic approach.
机译:文本聚类在信息检索的许多应用中很重要。本文提出了一种使用语义相似性方法在印度尼西亚语中将短文本聚类的研究,其中同义词和下义词的词典用于获取单词相关性的信息。我们比较基于词汇匹配和单词相似度的句子相似度计算。涉及超过250个句子。我们的实验表明,与基于语义方法的基于句子相似度的聚类相比,基于词法匹配的基于句子相似度的聚类在精度和F度量方面表现更好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号