本文では,Hidden Conditional Random Fields(HCRF)による映像の構造解析に基づくシーン分割の高精度化を試みる.映像には,各映像ジャンル毎に内容の出現パターンに特徴的な構造が存在する.提案手法では,このような映像に含まれる構造を,隠れ変数を持つ識別モデルであるHCRFを用いて表現する.具体的にはまず,映像のショット列から観測される特徴量に対してHCRFを適用し,ショットの状態遷移およびその位置関係の特性を学習する.次に,分析対象の映像が与えられた際に,学習したHCRFモデルから隠れ変数の事後確率を算出し,これを新たな特徴量として得る.このとき,ショット列の時系列パターンの特性を解析した結果として得られる隠れ変数に基づいた特徴量を定義することで,映像の構造情報を含む高次の特徴量の算出が可能になる.これにより,映像の特徴量を直接用いた場合に生じる精度の劣化を抑制したシーン分割が実現される.本文の最後では,実際に放映された映像を用いた実験を行い,提案手法の有効性を評価する.
展开▼