...
首页> 外文期刊>電子情報通信学会技術研究報告 >サポートベクトルマシンのラベル並べ替え解のパス追跡とマイクロアレイデータ解析への応用に関する一考察
【24h】

サポートベクトルマシンのラベル並べ替え解のパス追跡とマイクロアレイデータ解析への応用に関する一考察

机译:支持向量机标签重排解决方案的路径跟踪及其在微阵列数据分析中的应用

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

マイクロアレイ技術により多くの遺伝子発現量を同時に計測できるようになった.マイクロアレイデータ解析の基本的なタスクは,健常者とがん患者などの二群において発現量の異なる遺伝子を同定することである.本研究では個々の遺伝子を対象とするのでなく,生物学的に関連の深い複数の遺伝子から成るグループ(遺伝子グループ)のうち,二群で発現パターンの異なっているものを同定する問題を考察する.このような遺伝子グループを同定する問題は遺伝子グループ解析(gene set analysis)と呼ばれ,多変量二標本検定として定式化される.本研究ではこの問題のためにサポートベクトルマシン(SVM)の分類誤差を統計量とする多変量二標本検定を導入する.このアプローチにおいては,統計量の帰無分布をラベル並べ替え演算により推定するため,SVMの学習(最適化)を多数回行わなくてはならない.本稿では,並べ替えられたラベルに対するSVMの最適解を効率的に計算するための方法論としてパス追跡を用いたアルゴリズムを提案する.%Microarray technology enables us to measure expression levels of thousands of genes simultaneously. The fundamental task of microarray data analysis is to find differentially expressed genes between two samples. In this study we consider how to find differentially expressed gene sets (rather than individual genes) between two samples. This task is called gene set analysis and it is mathematically formulated as multivariate two-sample test. As an approach of gene set analysis, we introduce a multivariate two-sample test whose test statistic is given by the classification error of support vector machine (SVM) classifier. The null distribution of the statistic is computed based on label permutation operation, and thus we need to train many SVM classifiers for permuted labels. In this paper we are concerned with the problem of reducing the computational cost of this operation by proposing a path-following algorithm to compute the path of label-permuted SVM classifiers.
机译:微阵列技术使同时测量多种基因表达水平成为可能。微阵列数据分析的基本任务是鉴定健康和癌症患者中不同表达水平的基因。这项研究考虑的问题不是识别单个基因,而是识别在具有多个生物学相关基因的两组(基因组)中具有不同表达方式的组。识别此类基因组的问题称为基因集分析,被表述为多变量两样本检验,在本研究中,我们针对此问题对支持向量机(SVM)进行分类。我们引入了以误差为统计量的多变量两样本检验,这种方法通过标签排列操作来估计统计量的零分布,因此必须对SVM进行多次训练(优化)。在本文中,我们提出了一种算法,该算法使用路径跟踪作为一种方法来有效地计算分类标签的SVM最优解。%芯片技术使我们能够同时测量数千个基因的表达水平。微阵列数据分析的基本任务是在两个样本之间找到差异表达的基因。在这项研究中,我们考虑如何在两个样本之间找到差异表达的基因集(而不是单个基因)。该任务称为基因集分析,在数学上是作为基因组分析的一种方法,我们引入了一个多变量两样本检验,该检验给出了检验统计量。根据支持向量机(SVM)分类器的分类误差,基于标签置换操作计算统计量的零分布,因此需要为置换标签训练许多SVM分类器。通过提出一种路径跟踪算法来计算标签置换SVM分类器的路径,从而降低了此操作的计算成本。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号