首页> 外文会议>統計関連学会連合大会 >高次元データにおける距離加重判別分析の漸近的性質とバイアス補正
【24h】

高次元データにおける距離加重判別分析の漸近的性質とバイアス補正

机译:高维数据距离加权辨别分析的渐近特性和偏置校正

获取原文

摘要

本講演では,高次元小標本データに対する判別分析を考える.母集団が2個あると想定し, 各母集団π_(i=1,2)は平均にd次べクトルμ_i,共分散行列にd次正定値対称行列Σ_iをもつと仮定する.各母集団π_iからn_i(≥2) 個の学習データx_(i1),...,x_(in_i),を無作為に抽出する. N=n_1+n_2とし,d>Nを仮定する.判別対象のd次元データをx_0とし,x_0 ∈π_1 もしくはx_0∈π_2を仮定し,x_0 ∈π_1のときに判別対象を誤判別する確率をe(1)とし,e(2)も同様の表記とする.また,Δ =‖μ_1μ_2‖,△_* =△+tr(Σ_1)/n_1+tr(Σ_2)/n_2とする.Vapnik 等が考案したサポートベクターマシン(SVM)は高次元データ解析において疎な解を与え,汎化性能が良いことが知られている.特に,Nakayama et al. (2017, JSPI)はSVMの漸近的性質を高次元小標本の枠組みで理論的に研究し, e(i) → 0 as d →∞ for i =1,2 (1) なる一致性を示すための正則条件を導出している.一方で,Marron et al. (2007, JASA)は,高次元のもとで,SVMがdata pilingという現象を引き起こすことを指摘した.data piling とは,訓練データの多くがサポートベクターになることを意味し,過学習を引き起こす要因にもなつている.さらに,Marronetal. (2007, JASA)は,data pilingを避けるようSVMのマージンを調整し,距離加重判別分析(DWD)を提案した.DWDでは,すべての訓練データと分離平面との距離の逆数の和が最小となるように分離平面を求めており,全ての訓練データを利用し分離平面を求めるため,性能が安定しやすいと言われている.しかしながら,高次元小標本データに対するDWDの精度保証については理論的な研究が乏しい.
机译:在本讲,考虑高维小样本数据的判别分析。假设有两个群体,每个群体π_(I = 1,2)是d - 叔到d -Te-到科特尔μ_I,协方差矩阵D.假设它具有下一个正确的值对称矩阵σ_i。每个群体π_i随机从每群中提取π_i,...,X_(in_i)。N = N_1 + N_2,d> n被假设该d维数据要被鉴别是X_0,X_0∈π_1或X_0∈π_2,并且在X_0∈π_1Ë歪曲判别对象的概率(1)由于E(2)是相同的符号。此外,Δ=‖μ_1μ_2 ‖,Δ_ * =Δ+ TR(σ_1)/ N_1 + TR(σ_2)/ N_1 + TR(σ_2)由Vapnik等机(SVM)设计/ N_2。支持矢量是已知的,得到在高稀疏溶液维数据分析,和泛化性能好。在E(i)的框架理论上研究→0 AS d→∞对于i = 1,2(1)导出。在另一方面,MARRON等人(2007, JASA)指出,SVM使SVM引起数据打桩。数据打桩装置,许多训练数据将是一个支持向量,从而导致重叠还有一个因素。此外,Marronetal。(2007,JASA)调整了SVM余量为了避免数据打桩并提出距离加权判别分析(DWD)。DWD所有训练数据的分离平面被确定为使得从所述平面的距离的倒数的总和被最小化分离,并且据说表现容易稳定的,因为它使用了所有的训练数据。然而,高维小的理论研究是稀缺DWD的精度保证了样本数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号