...
首页> 外文期刊>電子情報通信学会技術研究報告. サービスコンピューティング. Services computing >Correlation Between Taxonomy Data Distribution and Classification Performance
【24h】

Correlation Between Taxonomy Data Distribution and Classification Performance

机译:分类数据分布与分类性能之间的相关性

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Web is providing tremendously increasing amount of information and mining it from a data on the Web has been recognized as critical issue in big data analytics. Classification is one of important technique for data mining, and performance of image or text data classification by machine learning has been investigated a lot. Our interest in this paper is ontological text data distribution to observe classification performance of the data. Classification performance on documents by ontological taxonomy is important to get information with intelligence that makes reasoning among identified objects. Analysis of data distribution of the ontological data was carried out by data clustering and Principle Component Analysis (PCA). We found that overlap distance of document clusters has a strong negative relationship to classification accuracy.
机译:Web正在提供大量的信息,并从Web上的数据挖掘它已被识别为大数据分析中的关键问题。 分类是数据挖掘的重要技术之一,并且已经调查了通过机器学习的图像或文本数据分类的性能。 我们对本文的兴趣是在本体文本数据分布,以遵守数据的分类性能。 本体分类学的文档上的分类性能对于获取智能的信息是重要的,这使得在已识别的物体之间进行推理。 通过数据聚类和原理分析(PCA)进行了本体数据分布的分析。 我们发现文档集群的重叠距离与分类准确性有很强的负面关系。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号