首页> 外文期刊>Research journal of applied science, engineering and technology >Term Frequency Based Cosine Similarity Measure for Clustering Categorical Data using Hierarchical Algorithm
【24h】

Term Frequency Based Cosine Similarity Measure for Clustering Categorical Data using Hierarchical Algorithm

机译:基于术语频率的余弦相似度度量用于分类数据聚类

获取原文
获取原文并翻译 | 示例
       

摘要

Object in real world are categorical in nature. Categorical data are not analyzed as numerical data because of the absence of inherit ordering. In this study performance of cosine based hierarchical clustering algorithm for categorical data is evaluated. It make use of two functions such as Frequency Computation, Term Frequency based Cosine Similarity Matrix (TFCSM) computation. Clusters are formed using TFCSM based hierarchical clustering algorithm. Results are evaluated for vote real life data set using TFCSM based hierarchical clustering and standard hierarchical clustering algorithm using single link, complete link and average link method.
机译:现实世界中的对象本质上是绝对的。由于没有继承顺序,分类数据不作为数值数据进行分析。在这项研究中,对基于余弦的分类数据分层聚类算法的性能进行了评估。它利用了两个功能,例如频率计算,基于术语频率的余弦相似度矩阵(TFCSM)计算。使用基于TFCSM的层次聚类算法形成聚类。使用基于TFCSM的层次聚类和标准层次聚类算法(使用单链接,完整链接和平均链接方法)对投票现实生活数据集的结果进行评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号