首页> 外文OA文献 >Semantic Analysis of High-definition MPEG-2 Soccer Video Using Bayesian Network
【2h】

Semantic Analysis of High-definition MPEG-2 Soccer Video Using Bayesian Network

机译:贝叶斯网络对高清MPEG-2足球视频的语义分析

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

近年,インターネットのブロードバンド化に伴い,映像配信が普及し,また,地上デジタル放送や,BS・CSデジタル放送などの衛星放送により,ユーザが試聴できる番組の数が急増してきている.パソコンやレコーダのハードディスクの容量も増え,大量の番組(コンテンツ)を保存することが可能となったが,その反面,膨大な映像データの中から,視聴者の求めるシーンを素早く検索する技術の必要性がこれまでにも増して高まって来ている.本研究はサッカー映像のリプレーシーンとゴール付近のハイライトシーンの検出方法を提案する.シーンの検出には,MPEG-2エンコーダによって圧縮されたハイビジョンサッカー映像から抽出した特徴量とハイライトシーンとの間の因果関係をベイジアンネットワークで記述する手法を用いる.ベイジアンネットワークを用いることにより,抽出された特徴量からハイライトシーンの発生を確率的に推論することが可能になる.すでにベイジアンネットワークを用いたサッカー映像のハイライトシーンの検出法は提案されているが,それらの方法では,フレーム毎に画素単位でさまざまな画像処理を映像に施すことによって求めた特徴量を利用している.そのため,画面が大きくなると計算コストも大きくなるので,リアルタイム処理には専用の処理装置が必要になる.本研究で提案する方法はMPEG-2圧縮データに含まれている符号化パラメータから特徴量を計算するので,従来法に比べて計算量が少なく,ハイビジョンなどの高解像度映像であっても,通常のPCを用いてリアルタイム処理が可能である.また,従来法では各種シーンに対してベイジアンネットワークが提案されているが,いずれも,ネットワークモデル中のシーンに関わるイベントがすべてフレーム単位で定義されている.例えば,従来法のゴールシーンに関わる,ゴールゲートの出現,観客の声,リプレーの発生等のイベントは全てフレーム単位で数えている.しかし,各イベントの開始・終了フレームを明確に判定する手法が明らかにされておらず,場合によっては人の手で行わなう必要がある.そのため,ベイジアンネットワークを学習する時に、各種イベントの時間帯の与え方に誤差が含まれる可能性がある.さらに、テストビデオから,シーン検出する時,シーンの始終時間帯の検出も困難である.本研究の提案手法では,まず,MPEG-2圧縮データから直接抽出した符号化パラメータの特徴的な変化から,カメラの切り換えに伴う画面の切り替るカット点を検出し,隣接する二つのカット点間をショットとして定義する.さらに各ショットの特徴量を調べることにより,ショットをいくつかのイベントクラスに分類する.さらに,シーンをある特徴的なイベントの発生として捉えることにより,シーンの検出を行う.本手法では,各イベントの開始・終了時刻をショットのカット点によって明確に与えることができることができ,しかもMPEG-2圧縮データから自動的に求めることが可能である.提案方式の性能評価のために,実際のビデオデータを使用した検出実験を行ったところ,ゴール付近で起こるイベントシーンの再現率が86.17%,適合率90.76%,またリプレーシーンの再現率が81.00%, 適合率92.57%という検出結果が得られた.一方,従来法の検出結果では,同一のビデオデータではないが,ゴール付近で起こるイベントシーンの再現率71.1%,適合率89.8%であり,提案方式のほうが従来法に比べ,再現率,適合率ともに上回り,とくに再現率の向上が顕著である.以上のことより,提案法の有効性が確認された.
机译:近年来,随着互联网宽带的普及,由于诸如地面数字广播和BS / CS数字广播的卫星广播,视频分发已经变得广泛,并且用户可以收听的节目的数量正在迅速增加。尽管个人计算机和录像机的硬盘容量增加了,但可以存储大量程序(内容)成为可能,但是另一方面,仍需要一种技术来从大量视频数据中快速找到观看者想要的场景。性生活比以往任何时候都多。这项研究提出了一种用于检测足球视频中的重播场景并突出显示目标附近场景的方法。为了检测场景,我们使用贝叶斯网络方法来描述从MPEG-2编码器压缩的高清足球视频中提取的特征与精彩场面之间的因果关系。通过使用贝叶斯网络,可以从提取的特征中概率地推断出高光场景的发生。尽管已经提出了使用贝叶斯网络检测足球视频中精彩场面的方法,但是这些方法利用了通过对每个帧的像素单位对视频执行各种图像处理而获得的特征。 ing。因此,计算成本随着屏幕尺寸的增加而增加,因此需要专用的处理设备进行实时处理。由于本研究中提出的方法是根据MPEG-2压缩数据中包含的编码参数来计算特征的,因此与传统方法相比,它所需的计算量更少,即使它是高分辨率图像(如高清)使用PC可以进行实时处理。另外,在传统方法中已经提出了用于各种场景的贝叶斯网络,但是在所有这些中,与网络模型中的场景有关的所有事件都以帧为单位定义。例如,与常规方法的球门场景有关的事件,例如球门的出现,观众的声音和重放的发生,都以帧为单位进行计数。但是,确定每个事件的开始和结束帧的方法尚不清楚,可能需要手动执行。因此,当学习贝叶斯网络时,有可能在为各种事件提供时区的方式中包括错误。此外,当从测试视频检测场景时,难以检测场景的开始和结束时区。在本研究提出的方法中,首先,从直接从MPEG-2压缩数据中提取的编码参数的特征变化以及两个相邻的切割点之间,检测由于摄像机切换而导致屏幕变化的切割点。被定义为射击。此外,通过检查每个镜头的特征量,将镜头分为几个事件类别。此外,通过捕获场景作为特征事件的发生来检测场景。使用这种方法,可以通过镜头的切入点清楚地给出每个事件的开始和结束时间,此外,还可以从MPEG-2压缩数据中自动获取它们。为了评估该方法的性能,进行了基于实际视频数据的检测实验,目标​​附近事件场景的召回率为86.17%,准确率为90.76%,召回率为81.00%。因此,获得了准确率为92.57%的检测结果。另一方面,在传统方法的检测结果中,尽管视频数据不尽相同,但在目标附近发生的事件场景的召回率是71.1%,准确率是89.8%,与传统方法相比,提出的召回率和准确率更高。两者都超过了,召回率特别提高。从上面可以确认所提出方法的有效性。

著录项

  • 作者

    Jiang Feihu;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 en
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号