...
首页> 外文期刊>電子情報通信学会論文誌 >大規模映像資源のためのマルチモーダル高次特徴検出
【24h】

大規模映像資源のためのマルチモーダル高次特徴検出

机译:大规模视频资源的多峰高阶特征检测

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

あらまし 本研究では,映像の中から「飛行機」や「歌っている人」といった高次特徴を検出するタスクに対し,SIFT特徴とMFCC特徴の混合ガウス分布(GMM)を用いた統計的手法を提案する.検出手法には,話者認識などで用いられてきたゆう度比による検出と,GMMSupervectorSVM(GS-SVM)による検出の二つを用いる.ゆう度比による検出では,高次特徴が出現する部分としない部分のGMMをそれぞれ学習し,二つのモデルから得られるゆう度の比をもとに高次特徴を検出する.GS-SVMでは,各ショットに対するGMMを求め,GMM閥の距離から定義されるRBFカーネルを用いたSVMで学習・識別を行う.最後に,各手法から対数ゆう度比を求め,その重み付き和により手法の融合を行う.TRECVID2009のデータセットを用いて評価実験を行った結果,MeanAveragePrecisionはSIFT特徴とGS-SVMを用いた場合の0.141から,融合手法により0.173まで向上した.
机译:总结在这项研究中,我们提出了一种使用SIFT和MFCC特征的混合高斯分布(GMM)的统计方法,用于检测视频中的“飞机”和“唱歌人”等高阶特征。做。使用两种检测方法:已经用于说话者识别等的似然比检测,以及GMM SupervectorSVM(GS-SVM)检测。在通过似然比进行检测时,学习出现高阶特征的部分和不存在高阶特征的部分的GMM,并根据从这两个模型获得的似然比对高阶特征进行检测。在GS-SVM中,获得每个镜头的GMM,然后由SVM使用由GMM派系的距离定义的RBF内核执行学习和识别。最后,从每种方法获得对数似然比,并将这些方法与加权和融合。使用TRECVID2009数据集进行评估实验的结果是,通过融合方法使用SIFT特征和GS-SVM时,平均平均精度从0.141提高到0.173。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号