首页> 中国专利> 基于隐条件随机场的足球视频进球事件检测方法

基于隐条件随机场的足球视频进球事件检测方法

摘要

本发明公开了一种基于隐条件随机场的足球视频进球事件检测方法,主要解决现有技术不能同时具有隐状态表达能力和表达交叠性特征的问题。其实现步骤是:首先,对训练视频和测试视频进行物理镜头分割和语义镜头标注,判断每个训练视频是否含进球事件,得到类别标签,将训练视频的语义镜头序列和类别标签组成训练数据集,将测试视频的语义镜头序列组成测试数据集;接着,根据训练数据集,调用Matlab工具包HCRF2.0b中trainHCRF函数计算模型参数,建立进球事件的隐条件随机场模型;最后,根据已建立模型,调用testHCRF函数计算测试视频对应不同类别标签的概率,进行进球事件检测。本发明能够准确、全面实现进球事件检测,可用于足球视频精彩事件检测等语义分析领域。

著录项

  • 公开/公告号CN102306154A

    专利类型发明专利

  • 公开/公告日2012-01-04

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201110180085.2

  • 发明设计人 同鸣;谢文娟;张伟;

    申请日2011-06-29

  • 分类号G06F17/30(20060101);G06K9/62(20060101);

  • 代理机构61205 陕西电子工业专利中心;

  • 代理人王品华;朱红星

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2023-12-18 04:00:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-11

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20130320 终止日期:20180629 申请日:20110629

    专利权的终止

  • 2013-03-20

    授权

    授权

  • 2012-02-22

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20110629

    实质审查的生效

  • 2012-01-04

    公开

    公开

说明书

技术领域

本发明属于视频信息检索领域,涉及体育视频语义分析,可用于足球视频进 球事件检测中,以准确、全面地检测进球事件。

背景技术

体育视频因为拥有庞大的受众群体和巨大的商业价值而备受研究者和社会 各界的广泛关注。体育视频的精彩事件自动检测一直是视频语义分析领域研究的 热点,其难点在于必须解决低层特征到高层语义之间的语义鸿沟,对此国内外学 者进行了广泛的研究,取得了不菲的研究成果。

目前的方法主要有:

(1)Sadlier D A,O′Connor N E.Event detection in field sports video using  audio-visual features and a support vector machine[J]IEEE Trans.on Circuits and  Systems for Video Technology,2005,15(10):1225-1233。该方法通过建立音视频特 征检测单元,采用支持向量机对提取特征进行融合,实现了足球、橄榄球等视频 中eventful和noneventful事件的检测。该方法由于把语义事件检测问题直接作为 特征分类问题解决,而没有充分利用语义信息,其事件检测正确率仅达到74%。

(2)Ding Y,Fan G L.Sports Video Mining via Multichannel Segmental  Hidden Markov Models[J]IEEE Trans.on Multimedia,2009,11(7):1301-1309。该 方法基于隐马尔科夫建模时序规律的良好性能,构建了多通道部分隐马尔科夫模 型,能够同时进行视频结构的分层次、并行分析,较准确地捕获了多个隐马尔科 夫链之间的交互规律,语义事件检测正确率达到了87.06%,但模型的构建比较 复杂。

(3)Xu C S,Zhang Y F,Zhu G Y,et al.Using webcast text for semantic event  detection in broadcast sports video[J]IEEE Trans.on Multimedia,2008,10(7): 1342-1355。这种方法采用潜在的语义分析方法检测网络文本中的关键事件,将 文本检测结果和低层特征作为条件随机场模型的输入,实现足球、篮球体育视频 中多种语义事件的检测。但这种方法构建模型的过程比较耗时,未采用隐藏状态 变量,不能更有效地挖掘语义事件的潜在规律,限制了检测性能的提高。

发明内容

本发明目的是针对上述已有技术的不足,提出一种基于隐条件随机场的足球 视频进球事件检测方法,以简化复杂的模型构建过程,减少建模耗时,提高事件 检测正确率。

为实现上述目的,本发明的技术方案包括如下步骤:

(1)定义语义镜头集为ε={s1,s2,s3,s4,s5},其中,s1,s2,s3,s4,s5表示五种 语义镜头,即s1为远镜头,s2为中镜头,s3为特写镜头,s4为观众镜头,s5为 回放镜头;

(2)定义进球事件的隐条件随机场的类别标签集为α={0,1},其中,0表 示进球事件的隐条件随机场模型的输入不包含进球事件,1表示进球事件的隐条 件随机场模型的输入包含进球事件;

(3)对N1个训练视频片段和N2个测试视频片段分别进行物理镜头分割, 得到第d个训练视频片段的物理镜头序列Pd和第e个测试视频片段的物理镜头 序列Qe,其中,d∈{1,2,L,N1},e∈{1,2,L,N2};

(4)对第d个训练视频片段的物理镜头序列Pd中的物理镜头和第e个测试 视频片段的物理镜头序列Qe中的物理镜头分别进行语义标注,得到由远镜头、 中镜头、特写镜头、观众镜头和回放镜头组成的第d个训练视频片段的语义镜头 序列Od和第e个测试视频片段的语义镜头序列Ze

(5)对第d个训练视频片段,人工判断是否包含进球事件,得到第d个训 练视频片段的类别标签λd,λd∈α;

(6)将N1个训练视频片段的语义镜头序列O1,O2,L,和N1个训练视频片 段的类别标签λ1,λ2,L,作为训练数据集将 N2个测试视频片段的语义镜头序列Z1,Z2,L,作为测试数据集 Z={Z1,Z2,L,ZN2};

(7)根据训练数据集O中的N1个语义镜头序列O1,O2,L,和对应的N1个 类别标签λ1,λ2,L,调用Matlab工具包HCRF2.0b中trainHCRF函数,计算 进球事件的隐条件随机场模型的模型参数θ,并利用模型参数θ建立进球事件的 隐条件随机场模型,其中,函数trainHCRF的调用格式为θ=trainHCRF(trainseqs, trainlabels,params),trainseqs为训练数据集中的N1个语义镜头序列O1,O2,L,trainlabels为对应的N1个类别标签λ1,λ2,L,params为函数参数, params.nbHiddenStates为隐状态个数N,取值为3,params.windowsize为窗长度 ω,取值为1,params.optimizer为优化算法,选择bgfs算法,params.maxIterations 为最大迭代次数,取值为300;

(8)根据进球事件的隐条件随机场模型和测试数据集Z,调用Matlab工具 包HCRF2.0b中testHCRF函数,计算测试数据集Z中第e个测试视频片段的语 义镜头序列Ze对应于类别标签0的概率βe,0,以及该语义镜头序列对应于类别标 签1的概率βe,1

(9)若βe,0>βe,1,则第e个测试视频片段的语义镜头序列Ze的预测类别标 签为0,该测试视频片段不包含进球事件,若βe,0<βe,1,则第e个测试视频片段 的语义镜头序列Ze的预测类别标签为1,该测试视频片段包含进球事件,若 βe,0=βe,1,则无法判断第e个测试视频片段是否包含进球事件。

本发明与现有技术相比具有以下优点:

1)本发明由于建立的进球事件的隐条件随机场模型同时具有隐状态表达能 力和表达长距离依赖性和交叠性特征的能力,能够更自然地对足球视频中的时空 邻域关系进行建模;

2)本发明由于将视频的物理镜头标注为语义镜头,然后将语义镜头序列作 为进球事件的隐条件随机场模型的输入进行进球事件的检测,有效缓解了低层特 征到高层语义之间的语义鸿沟,改善了进球事件的检测性能。

附图说明

图1是足球视频进球序列与非进球序列的代表帧示例图;

图2是隐条件随机场模型示意图;

图3是本发明的流程图。

具体实施方式

一、基础理论介绍

足球比赛深受大众喜爱,但一场比赛视频数据量巨大,观众感兴趣的精彩事 件通常只是整场比赛的很小一部分,因此,对比赛视频进行分析和处理,实现进 球、罚球等精彩事件的语义检测在足球视频语义分析领域至关重要。然而,足球 比赛视频有着特定的结构,深入、准确地挖掘这种内在的结构特征和联系,建立 有效的足球比赛视频结构模型,使得精彩事件的语义检测成为可能,在体育视频 语义分析领域具有重要的理论价值和市场应用前景。

足球比赛视频片段可分为进球视频片段和非进球视频片段,每个片段包括远 镜头、中镜头、特写镜头、观众镜头和回放镜头,通过对大量真实比赛视频的 分析发现,进球片段含有较多的特写镜头和回放镜头、较少的远镜头和中镜头。 图1是足球视频中进球序列和非进球序列的代表帧示例图,其中图1(a)是进球序 列,它用5个镜头展示了一次进球事件,这5个镜头为射门全景远镜头、射门球 员特写镜头、观众镜头、包含若干球员的中镜头和回放镜头;图1(b)是非进球序 列,它用远镜头与中镜头的交叉显示展示了一次非进球事件。

隐条件随机场是一种具有隐状态变量的无向图概率模型。给定一个观察值序 列,在隐条件随机场模型中存在一个对应的隐状态序列,当前时刻的隐状态既可 以只根据当前时刻的观察值元素预测产生,也可以根据当前时刻的观察值元素和 相邻观察值元素共同预测产生。

隐条件随机场的具体定义如下。假设需要对一个输入序列x′预测标签β0, 其中,β0为标签集Γ中的一个元素,输入序列x′也称为观察序列,是一个观察 值集合x′={x′1,x′2,L,x′a′}。在不同的输入序列中,观察值集合的元素数目a′是可 变的。每个观察值元素x′c由一个特征向量φ(x′c)表示,其中,c∈{1,2,L,a′}, m为维数。训练数据集由观察序列-类别标签数据对(xj,βj)组成, 其中,βj∈Γ,j=1,2,L,N,aj为第j个观察序列中元 素个数,N为训练数据集中观察序列-类别标签数据对的数目。测试数据集由观 察序列组成。

图2是隐条件随机场模型示意图,其中,u={u1,u2,L,ut}为隐条件随机场模 型的输入观察序列,ρ={ρ1,ρ2,L,ρt}为输入观察序列u对应的隐状态序列,它 根据观察序列u产生,并且在训练数据集中是无法被观察的, ργ∈Ω,γ∈{1,2,L,t},Ω为隐条件随机场的隐状态集合,隐状态ργ对应于观察 序列u中的观察值元素uγ,ργ可以仅仅根据单个观察值元素uγ预测产生,也可 以根据观察值元素uγ和其它观察值元素共同预测产生,类别标签z根据隐藏状态 之间的结构得到。

在给定输入序列x′和隐条件随机场模型参数θ的条件下,计算输入序列x′具 有标签β′的概率:

P(β|x;θ)==Σηexp(Ψ(β,η,x;θ))Στ,ηexp(Ψ(τ,η,x;θ))

其中,x′为输入序列,β′为输入序列x′可能对应的标签,β′∈Γ,θ为隐条 件随机场的模型参数,τ为输入序列x′可能对应的标签,τ∈Γ, η={η1,η2,L,ηa′}为输入序列x′对应的隐状态序列,是以θ为 参数的势函数,势函数按下式计算:

Ψ(β,η,x;θ)=Σc=1aφ(xc)·θ(ηc)+Σc=1aθ(β,ηc)+Σ(c,c)Eθ(β,ηc,ηc)

其中,φ(x′c)为输入序列x′中第c个观察值元素x′c的特征向量表示, ηc∈Ω,θ(ηc)为对应于第c个隐状态ηc的参数矢量, 矢量维数为m维,内积φ(x′c)·θ(ηc)为观察值元素x′c与隐状态ηc的兼容性度量, 为隐状态ηc与类别标签β′的兼容性度量,为隐状态 ηc和隐状态ηc′的联合与类别标签β′的兼容性度量,E为隐条件随机场模型的无 向图,c′∈{1,2,L,a′},隐状态表示无向图的节点,若某个观察值元素同时与隐 状态ηc、隐状态ηc′有关,则在无向图E中存在边(c,c′)。

根据输入序列x′具有标签β′的概率P(β′|x′;θ),计算输入序列x′的预测标 签β0

β0=argmaxβ′∈ΓP(β′|x′;θ)。

二、足球视频进球事件检测方法

参照图3,本发明基于隐条件随机场的足球视频进球事件检测方法,步骤如 下:

步骤1,定义语义镜头集为ε={s1,s2,s3,s4,s5},其中,s1,s2,s3,s4,s5表示五 种语义镜头,即s1为远镜头,s2为中镜头,s3为特写镜头,s4为观众镜头,s5为 回放镜头。

步骤2,定义进球事件的隐条件随机场的类别标签集为α={0,1},其中,0 表示进球事件的隐条件随机场模型的输入不包含进球事件,1表示进球事件的隐 条件随机场模型的输入包含进球事件。

步骤3,对N1个训练视频片段和N2个测试视频片段分别进行物理镜头分 割,得到第d个训练视频片段的物理镜头序列Pd和第e个测试视频片段的物理 镜头序列Qe,其中,d∈{1,2,L,N1},e∈{1,2,L,N2}。

步骤4,对第d个训练视频片段的物理镜头序列Pd中的物理镜头和第e个测 试视频片段的物理镜头序列Qe中的物理镜头分别进行语义标注,即对包含语义 信息的物理镜头赋予一个语义标签,得到由远镜头、中镜头、特写镜头、观众镜 头和回放镜头组成的第d个训练视频片段的语义镜头序列Od和第e个测试视频 片段的语义镜头序列Ze

(4.1)将第d个训练视频片段的物理镜头序列Pd中的物理镜头和第e个测 试视频片段的物理镜头序列Qe中的物理镜头都分别标注为实时镜头与回放镜 头:

(4.1a)将含有N3幅帧图像的训练视频片段或测试视频片段中的每一幅帧图 像从RGB颜色空间转换为HSV颜色空间,其RGB颜色空间由红色分量R,绿 色分量G和蓝色分量B组成,转换后得到色度分量H的值h、饱和度分量S的 值s、亮度分量V的值v:

h=0,ifMAX=MIN16×g-bMAX-MIN,ifMAX=r>b16×g-bMAX-MIN+1,ifMAX=r><b16×b-rMAX-MIN+13,ifMAX=g16×r-gMAX-MIN+23,ifMAX=b

s=0,if>=0MAX-MINMAX=1-MINMAX,otherwise

v=MAX

其中,r为每一幅帧图像的每个像素点的红色分量R的归一化值,g为每 一幅帧图像的每个像素点的绿色分量G的归一化值,b为每一幅帧图像的每个像 素点的蓝色分量B的归一化值,MAX为每一幅帧图像的每个像素点的r、g、b 中的最大值,MIN为每一幅帧图像的每个像素点的r、g、b中的最小值,按下 式计算:

MAX=max(r,g,b)

MIN=min(r,g,b)

r=r255

g=g255

b=b255

其中,r′为每一幅帧图像的每个像素点的红色分量R的值,g′为每一幅帧 图像的每个像素点的绿色分量G的值,b′为每一幅帧图像的每个像素点的蓝色 分量B的值;

(4.1b)根据第n′幅帧图像中色度分量的值h所对应的第l级索引huel的像素 个数num(huel),计算第n′幅帧图像的色度分量的256柄直方图中索引huel对应 的值histn′(huel):

histn(huel)=num(huel)

其中,n′∈{1,2,L,N3},huel为第n′幅帧图像色度分量的第l级索引, l∈{1,2,L,256},huel∈{1,2,L,256};

(4.1c)根据第n+1幅帧图像的色度分量的直方图中索引huel对应的值 histn+1(huel)和第n幅帧图像的色度分量的直方图中索引huel对应的值 histn(huel),计算第n+1幅帧图像和第n幅帧图像的色度直方图差值HHDn

HHDn=1L×LΣl=1256|histn+1(huel)-histn(huel)|

其中,x∈{1,2,L,N3-1},L为每一幅帧图像的高度,K为每一幅帧图像的 宽度;

(4.1d)根据色度直方图差值HHDn,计算该视频片段的N3-1个色度直方图 差值的均值HHD:

HHD=1N3-1Σn=1N3-1HHDn;

(4.1e)选取HHDn大于阈值T2的帧,其中,阈值T2为该视频片段的HHD 的2倍,取T2=0.1938;

(4.1f)选取持续时间为10~20帧的镜头lsw,得到一系列的候选徽标镜头 其中,w∈{1,2,...,N4},N4为候选徽标镜头总数;

(4.1g)真实的徽标镜头必成对出现,徽标镜头中间的片段即为回放片段, 回放片段至少包含1个镜头。利用镜头分割程序检测候选徽标镜头lsw′和候选徽 标镜头lsw′-1之间的视频片段包含的镜头数目:如果该视频片段包含的镜头数目大 于1,将该视频片段中的镜头标注为回放镜头,如果该视频片段包含的镜头数目 等于1,将该视频片段中的镜头标注为实时镜头,其中,w′∈{2,3,L,N4};

(4.2)将实时镜头进一步标注为远镜头、中镜头和非场地镜头,其中远镜 头提供比赛进行的全局情况,通常含有很大的场地面积,中镜头描述一个或若干 个球员的全身以及动作,也含有一定的场地面积,但少于远镜头,因此,采用场 地比率PR来区分远镜头和中镜头,即一幅帧图像的场地像素点个数和总像素点 个数的比值,当某些远镜头含有部分观众区域时,场地面积减少,场地比率PR 也减小,很容易将远镜头和中镜头错误标注,故本发明将帧图像顶部裁剪去三分 之一后,根据场地比率PR和选取的阈值,将实时镜头进一步标注为远镜头、中 镜头和非场地镜头:

(4.2a)在实时镜头中选取60幅远景帧图像,根据第p幅帧图像的色度分 量的256柄直方图中索引huel对应的值histp(huel),计算60幅远景帧图像的色 度分量的累加直方图中索引huel对应的值sh(huel):

sh(huel)=Σp=160histp(huel)

其中,huel为第p幅帧图像色度分量的第l级索引,l∈{1,2,L,256}, huel∈{1,2,L,256},p∈{1,2,L,60};

(4.2b)根据累加直方图中索引huel对应的值sh(huel),计算累加直方图的 峰值F:

F=max{sh(hue1),sh(hue2),L,sh(hue256)};

(4.2c)根据累加直方图中每个索引对应的值和累加直方图的峰值F,确定 满足如下条件的下限索引huelow

sh(huelower)≥0.2×F

sh(huelower-1)<0.2×F

其中,sh(huelow)为累加直方图中下限索引huelow对应的值,sh(huelow-1)为 累加直方图中索引huelow-1对应的值;

(4.2d)根据累加直方图中每个索引对应的值和累加直方图的峰值F,确定 满足如下条件的上限索引hueup

sh(hueupper)≥0.2×F

sh(hueupper+1)<0.2×F

其中,sh(hueup)为累加直方图中上限索引hueup对应的值,sh(hueup+1)为累 加直方图中索引hueup+1对应的值;

(4.2e)将实时镜头的每一幅帧图像裁剪去顶部三分之一,统计裁剪后每一 幅帧图像中色度分量的值h属于区间[huelow/256,hueup/256]的场地像素个数C1, 计算每一幅帧图像的场地比率PR:

PR=C123×L×K

其中,L为每一幅帧图像的高度,K为每一幅帧图像的宽度;

(4.2f)根据设定的阈值T3、T4和每一幅帧图像的场地比率PR,判断每一 幅帧图像的类型:

如果一幅帧图像的场地比率PR大于阈值T3,则该幅帧图像是远景帧图像,

如果一幅帧图像的场地比率PR小于等于阈值T3并且大于等于阈值T4,则该 幅帧图像是中景帧图像,

如果一幅帧图像的场地比率PR小于阈值T4,则该幅帧图像是非场地帧图 像,

其中,取阈值T3=0.70,T4=0.30;

(4.2g)若待标注实时镜头55%以上的帧图像属于远景帧图像,则标注该实 时镜头为远镜头;若待标注实时镜头55%以上的帧图像属于中景帧图像,则标注 该实时镜头为中镜头;否则标注为非场地镜头;

(4.3)将非场地镜头进一步标注为特写镜头与观众镜头,由于观众镜头中 观众数目较多,背景复杂,边缘信息丰富,特写镜头人物比例较大,平滑区域较 多,需用边缘像素比率EPR表示每一幅帧图像中边缘像素点个数与总像素点个 数的比率,故本发明根据边缘像素比率EPR和选取的阈值,按如下步骤将非场 地镜头进一步标注为特写镜头与观众镜头:

(4.3a)将非场地镜头的每一幅帧图像从RGB颜色空间转换到YCbCr颜色 空间,得到亮度分量Y的值y,蓝色色度分量Cb的值cr,红色色度分量Cr的值 cb:

y=0.299r′+0.578g′+0.114b′

cb=0.564(b′-y)

cr=0.713(r′-y)

其中,r′为每一幅帧图像的每个像素点的红色分量R的值,g′为每一幅帧 图像的每个像素点的绿色分量G的值,b′为每一幅帧图像的每个像素点的蓝色 分量B的值;

(4.3b)根据每一幅帧图像的亮度分量Y的值y,用Canny算子检测每一幅 帧图像中的边缘像素的个数C2

(4.3c)根据每一幅帧图像中的边缘像素的个数C2,计算待标注的非场地镜 头中每一幅帧图像的边缘像素比率EPR:

EPR=C2L×K

其中,L为每一幅帧图像的高度,K为每一幅帧图像的宽度;

(4.3d)若一幅帧图像的EPR大于阈值T5,标记为观众帧图像,否则标记 为特写帧图像,其中,取T5=0.10;

(4.3e)若待标注的非场地镜头55%以上的帧图像属于观众帧图像,则标注 该非场地镜头为观众镜头,否则标记为特写镜头。

步骤5,对第d个训练视频片段,人工判断是否包含进球事件,得到第d个 训练视频片段的类别标签λd,λd∈α。

步骤6,将N1个训练视频片段的语义镜头序列O1,O2,L,和N1个训练视频 片段的类别标签λ1,λ2,L,作为训练数据集将N2个测试视频片段的语义镜头序列Z1,Z2,L,作为测试数据集 Z={Z1,Z2,L,ZN2}.

步骤7,根据训练数据集O中的N1个语义镜头序列O1,O2,L,和对应的N1个类别标签λ1,λ2,L,调用Matlab工具包HCRF2.0b中trainHCRF函数,计 算进球事件的隐条件随机场模型的模型参数θ,并利用模型参数θ建立进球事件 的隐条件随机场模型,其中,函数trainHCRF的调用格式为θ= trainHCRF(trainseqs,trainlabels,params),trainseqs为训练数据集中的N1个语义镜 头序列O1,O2,L,trainlabels为对应的N1个类别标签λ1,λ2,L,params为 函数参数,params.nbHiddenStates为隐状态个数N,取值为3,params.windowsize 为窗长度ω,取值为1,窗长度表示隐条件随机场在预测当前时刻的隐状态时考 虑的观察值个数,ω=0表示隐条件随机场在预测当前时刻的隐状态时只考虑当 前时刻的观察值,ω=1表示预测当前时刻的隐状态时既考虑当前时刻的观察值 同时也考虑前一时刻和后一时刻的观察值,params.optimizer为优化算法,选择 bgfs算法,params.maxIterations为最大迭代次数,取值为300。

步骤8,根据进球事件的隐条件随机场模型和测试数据集Z,调用Matlab 工具包HCRF2.0b中testHCRF函数,计算测试数据集Z中第e个测试视频片段 的语义镜头序列Ze对应于类别标签0的概率βe,0,以及该语义镜头序列对应于类 别标签1的概率βe,1

步骤9,若βe,0>βe,1,则第e个测试视频片段的语义镜头序列Ze的预测类别 标签为0,该测试视频片段不包含进球事件,若βe,0<βe,1,则第e个测试视频片 段的语义镜头序列Ze的预测类别标签为1,该测试视频片段包含进球事件,若 βe,0=βe,1,则无法判断第e个测试视频片段是否包含进球事件。

本发明的效果可通过以下实验仿真进一步说明。

1)仿真条件

实验视频选自2010年南非世界杯多个场次的比赛,mpeg-1格式,帧分辨 率为352×288。实验视频分为两部分,一部分作为训练视频片段,含有21个进 球视频片段和10个非进球视频片段,剩余部分作为测试视频片段,含有50个进 球视频片段和20个非进球视频片段。实验软件环境为Matlab R2008a。

2)仿真内容及结果

仿真一:根据建立的进球事件的隐条件随机场模型,对70个测试视频片段 分别计算每个测试视频片段具有类别标签0的概率和类别标签1的概率,选择较 大概率对应的类别标签作为该测试视频片段的预测标签,从而判断该测试视频片 段是否含有进球事件。调用Matlab工具包HCRF2.0b中trainHCRF函数计算模 型参数θ时,参数优化算法选择BFGS算法,最大迭代次数为300,根据实验选 取隐状态个数N为3,窗长度ω分别为0、1、2,ω=0表示预测当前时刻的隐状 态时只考虑当前时刻的观察值,ω=1表示预测当前时刻的隐状态时既考虑当前 时刻的观察值同时也考虑前一时刻和后一时刻的观察值,ω=2表示预测当前时 刻的隐状态时既考虑当前时刻的观察值同时也考虑前两个时刻和后两个时刻的 观察值。实验结果如表1所示。

表1

从表1可以看出,本发明对于足球视频进球事件的最佳检测性能为查准率 98.04%、查全率100%。窗长ω=1时的查准率比ω=0的查准率有所提高,可见 考虑有效距离内观察值的依赖关系能明显提高进球事件的隐条件随机场模型的 检测性能,但是ω=2时的查准率比ω=1的查准率降低,是因为考虑了过长范围 的依赖关系,反而增加模型的复杂度,不能正确反映进球事件的内在规律,降低 隐条件随机场模型的性能。因此,本发明最终确定进球事件的隐条件随机场模型 的隐状态个数N为3,窗长度ω为1。

以上仿真结果表明,本发明提出的基于隐条件随机场的足球视频进球事件检 测方法,能够准确、全面地实现进球事件的检测。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号