父由来と母由来の遺伝情報が混同した状態のヒトのゲノムデータを,統計学的な手法を用いてそれぞれの情報に分離させる問題をハプロタイプ推定という.これは近年注目されている個別化医療において重要な技術であり,現在までに様々な手法が研究されてきた.特にHardy-Weinberg平衡を仮定してハプロタイプ頻度をEMァルゴリズムによって推定する手法の精度は非常に高いが,ハプロタイプ頻度のスパース性を利用しないため,多型座位数について指数的な計算量を必要とするという欠点がある.本研究ではハプロタイプ推定問題特有の性質に着目し,ハプロタイプ頻度の推定を,モーメント母関数を用いてスパース最適化へ帰着させる新たなアプローチを提案する.また,本手法によって得られる推定解の精度を,人工データを用いた実験により評価する.%Haplotype inference is a statistical problem to separate mixed human genomic information into maternal and paternal haplotypes. Intensive studies for this problem have been dedicated to contribute individualized medicine. One of the most successful studies is a method using EM algorithm with Hardy-Weinberg assumption. Its accuracy is generally quite high, but it suffers from exponential calculation cost regarding the number of polymorphic sites because it does not utilize the sparsity of haplotype frequencies. In this report, focusing on a property of the haplotype inference, we introduce a new approach to estimation of haplotype frequencies. Specifically, we use moment generating function and sparse optimization technique. We also evaluate the accuracy of the method with artificial data.
展开▼