Dissimilarity measures and divisive clustering for symbolic multimodal-valued data

Kim J.; Billard L.

首页> 外文期刊>Computational statistics & data analysis >Dissimilarity measures and divisive clustering for symbolic multimodal-valued data

【24h】

Dissimilarity measures and divisive clustering for symbolic multimodal-valued data

机译：符号多峰值数据的相异性度量和分裂聚类

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Nowadays, most government agencies and local authorities regularly and routinely collect a large amount of data from censuses and surveys and officially publish them for public purposes. The most frequently used form for the publication is as statistical tables and it is usually not possible to access the raw data for those tables due to privacy issues. Under these situations, we have to analyze data using only those aggregated tables. These tables typically have formats summarized by ordinal or nominal items. Tables for quantitative variables have histogram-valued formats and those for qualitative variables are represented by multimodal-valued types. Both are classes of the so-called symbolic data. In this study, we propose dissimilarity measures and a divisive clustering algorithm for symbolic multimodal-valued data. In order to split a partition efficiently at each stage, the algorithm extends the monothetic method for binary data. The proposed method is verified by simulation studies and applied to a work-related nonfatal injury and illness dataset.

机译：如今，大多数政府机构和地方政府定期并例行地从人口普查和调查中收集大量数据，并正式发布以用于公共目的。发布最常用的形式是统计表，由于隐私问题，通常无法访问这些表的原始数据。在这种情况下，我们仅需使用那些汇总表来分析数据。这些表通常具有按序号或标称项汇总的格式。定量变量的表具有直方图值格式，而定性变量的表则由多峰值类型表示。两者都是所谓的符号数据的类别。在这项研究中，我们为符号多模态值数据提出了相异性度量和分裂聚类算法。为了在每个阶段有效地分割分区，该算法扩展了二进制数据的单等方法。通过仿真研究验证了该方法的有效性，并将其应用于与工作相关的非致命伤害和疾病数据集。

著录项

来源
《Computational statistics & data analysis》 |2012年第9期|共14页
作者
Kim J.; Billard L.;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类概率论与数理统计;
关键词
Divisive clustering; Gowda-Diday dissimilarity measure; Ichino-Yaguchi dissimilarity measure; Multimodal-valued data;

机译：分裂聚类;Gowda-Diday差异测度;Ichino-Yaguchi差异测度;多峰值数据;

相似文献

外文文献
中文文献
专利

1. Dissimilarity measures and divisive clustering for symbolic multimodal-valued data [J] . Kim J., Billard L. Computational statistics & data analysis . 2012,第9期

机译：符号多峰值数据的相异性度量和分裂聚类
2. Multivalued type dissimilarity measure and concept of mutual dissimilarity value for clustering symbolic patterns [J] . Guru DS, Kiranagi BB Pattern Recognition: The Journal of the Pattern Recognition Society . 2005,第1期

机译：聚类符号模式的多值类型差异度量和互不相似值的概念
3. Possibilistic Fuzzy Clustering for Categorical Data Arrays Based on Frequency Prototypes and Dissimilarity Measures [J] . Zhengbing Hu, Yevgeniy V. Bodyanskiy, Oleksii K. Tyshchenko, International Journal of Intelligent Systems and Applications . 2017,第5期

机译：基于频率原型和相异性度量的分类数据阵列可能模糊聚类
4. Clustering of Symbolic Data through a Dissimilarity Volume Based Measure [C] . Kelly P. Silva, Francisco A. T. de Carvalho, M. Csernel IEEE International Joint Conference on Neural Networks . 2008

机译：通过基于不同卷的测量来聚类符号数据
5. Learning-Based Dissimilarity Measure for Rigid and Non-Rigid Medical Image Registration [D] . So, Wai King. 2017

机译：刚性和非刚性医学图像配准的基于学习的差异度量
6. Assessing Dissimilarity Measures for Sample-Based Hierarchical Clustering of RNA Sequencing Data Using Plasmode Datasets [O] . Pablo D. Reeb, Sergio J. Bramardi, Juan P. Steibel -1

机译：使用等离子数据集评估基于样本的RNA测序数据的分层聚类的相异性度量
7. A New Symbolic Dissimilarity Measure for Multivalued Data Type and Novel Dissimilarity Approximation Techniques [O] . Bapu B Kiranagi, D S Guru 2011

机译：一种新的多值数据类型的符号相异性度量与新的相异逼近技术

Dissimilarity measures and divisive clustering for symbolic multimodal-valued data

摘要

著录项

相似文献

相关主题

期刊订阅