首页> 外文OA文献 >MapReduce Based Feature Selection and Classification of Microarray Dataset
【2h】

MapReduce Based Feature Selection and Classification of Microarray Dataset

机译:基于MapReduce的微阵列数据集特征选择与分类

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Gene expression profiling has emerged as an efficient technique for classification, diagnosis and treatment of various diseases. The data retrieved from microarray contains the gene expression values of the genes present in a tissue. The size of such data varies from some kilobytes to thousand of Gigabytes. Therefore, the analysis of microarray dataset in a very short period of time is essential. The major setback of microarray dataset is the presence of a large number of irrelevant information, which hinders the amount of useful information present in the dataset and results in a large number of computations. Therefore, selection of relevant genes is an important step in microarray data analysis. After retrieving the required number of features, classification of the dataset is done. In this project, various methods based on MapReduce are proposed to select the relevant number of feature. After feature selection, Naïve Bayes Classifier and N-Nearest Neighbor is used to classify the datasets. These algorithms are implemented on Hadoop framework. A comparative analysis is done on these methodologies using microarray data of different sizes
机译:基因表达谱已经成为一种用于各种疾病分类,诊断和治疗的有效技术。从微阵列检索的数据包含组织中存在的基因的基因表达值。此类数据的大小从几千字节到千兆字节不等。因此,在非常短的时间内分析微阵列数据集至关重要。微阵列数据集的主要挫折是大量不相关信息的存在,这阻碍了数据集中存在的有用信息的数量并导致了大量的计算。因此,相关基因的选择是微阵列数据分析中的重要步骤。检索到所需数量的特征后,就完成了数据集的分类。在该项目中,提出了多种基于MapReduce的方法来选择相关的特征数量。选择特征后,使用朴素贝叶斯分类器和最近邻法对数据集进行分类。这些算法在Hadoop框架上实现。使用不同大小的微阵列数据对这些方法进行了比较分析

著录项

  • 作者

    Rath Nitish Kumar;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号