首页> 外文期刊>International Journal of Information Technology & Decision Making >Clustering categorical and numerical data: a new procedure using multidimensional scaling
【24h】

Clustering categorical and numerical data: a new procedure using multidimensional scaling

机译:分类和数值数据的聚类:使用多维标度的新过程

获取原文
获取原文并翻译 | 示例
       

摘要

In this paper, we present a concept based on the similarity of categorical attribute values considering implicit relationships and propose a new and effective clustering procedure for mixed data. Our procedure obtains similarities between categorical values from careful analysis and maps the values in each categorical attribute into points in two-dimensional coordinate space using multidimensional scaling. These mapped values make it possible to interpret the relationships between attribute values and to directly apply categorical attributes to clustering algorithms using a Euclidean distance. After trivial modifications, our procedure for clustering mixed data uses the k-means algorithm, well known for its efficiency in clustering large data sets. We use the familiar soybean disease and adult data sets to demonstrate the performance of our clustering procedure. The satisfactory results that we have obtained demonstrate the effectiveness of our algorithm in discovering structure in data.
机译:在本文中,我们提出了一种基于类别属性值相似性并考虑隐式关系的概念,并提出了一种新的有效的混合数据聚类程序。我们的过程通过仔细的分析获得了分类值之间的相似性,并使用多维标度将每个分类属性中的值映射到二维坐标空间中的点中。这些映射的值使得可以解释属性值之间的关系,并使用欧几里得距离将分类属性直接应用于聚类算法。经过微不足道的修改后,我们的混合数据聚类程序使用了k-means算法,该算法以聚类大型数据集的效率而闻名。我们使用熟悉的大豆疾病和成人数据集来证明我们的聚类程序的性能。我们获得的令人满意的结果证明了我们的算法在发现数据结构中的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号