In many data analysis applications, data are represented as high-dimensional feature vectors. Dimensionality reduction techniques such as principal component analysis are often used to interpret such high-dimensional data, or to pre-process the data for predictive modeling. Recently, there have been substantial research work on selective integration of heterogeneous data sources, including images, voices, and texts, for supervised learning, while not much work has been done in the context of unsupervised learning. In this paper, we propose an extension of the principal component analysis for multiple information sources by introducing importance of each information source, and give an efficient optimization algorithm that alternates subspace estimation and importance estimation. Experimental evaluation on map building from sensor data shows the effectiveness of the proposed method.%データ解析の多くの場面において,データは数十ないし数百,数千といった非常に高い次元のベクトルとして表現される.高次元データを人間が解釈するために,あるいは予測モデル構築の前処理として,主成分分析などの教師なし次元削減手法がしばしば用いられる.さらに,実際のデータ解析では,画像データ,音声データ,テキストデータなどの異種混合データを統合して扱う必要が生じるが,複数の異なるデータを統合して解析するための方法は,特に教師つき学習の文脈では近年盛んに研究が行われているものの,教師なし学習の文脈ではまだ少ない.そこで本論文では,次元削減法の代表的手法である主成分分析を,各情報源の重要度パラメータを導入した定式化を与えることによって複数情報源に拡張し,主成分の推定と情報源の重要度の推定を順に繰り返すような効率のよい最適化アルゴリズムを与える.また,観測データからの物体地図復元タスクを題材に,提案手法の有効性を確認する.
展开▼