首页> 中国专利> 一种具有视频语义分析功能的高清网络摄像机

一种具有视频语义分析功能的高清网络摄像机

摘要

本发明公开了一种具有视频语义分析功能的高清网络摄像机,涉及图像识别技术领域。本摄像机的结构是:镜头与图像传感器通过结构件实现光连接;数字信号处理单元分别与图像传感器、FLASH存储单元、DDR数据存储单元和网络传输单元连接。本方法包括视频语义元数据生成及同步传输。本发明将视频语义分析模块前置,实现单台摄像机的视频语义分析功能,形成实时的全时间段的语义分析,同时将视频语义元数据与视频数据同步传输到后端平台,后端平台在此基础上能实现海量视频的快速检索和定位,节约海量视频目标对象查找过程中的大量人力和物力;适用于大规模的高清视频监控应用。

著录项

  • 公开/公告号CN103379266A

    专利类型发明专利

  • 公开/公告日2013-10-30

    原文格式PDF

  • 申请/专利号CN201310280431.3

  • 申请日2013-07-05

  • 分类号H04N5/225(20060101);H04N7/18(20060101);

  • 代理机构42001 武汉宇晨专利事务所;

  • 代理人黄瑞棠

  • 地址 430074 湖北省武汉市洪山区邮科院路88号

  • 入库时间 2024-02-19 20:56:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-01-20

    授权

    授权

  • 2013-11-27

    实质审查的生效 IPC(主分类):H04N5/225 申请日:20130705

    实质审查的生效

  • 2013-10-30

    公开

    公开

说明书

技术领域

本发明涉及图像识别技术领域,尤其涉及一种具有视频语义功能的高清网络摄像机。 

背景技术

随着安防视频监控行业的发展,网络化、高清化和智能化已成为这个行业的发展趋势,随着智慧城市的推进,监控摄像头已经遍布大街小巷,产生海量的非结构化的图像数据,仅仅将视频图像记录下来只是第一步,有了相关视频图像不等于就找到了目标信息;在海量非结构化的视频图像数据中查找视频、分析视频的工作常常会耗用大量的时间和人力,能否在海量视频中更方便和更省力地查找到相关信息,如何从杂乱的非结构化数据中提取准确无误的关键信息;同时,如何高效存储和访问利用这些信息都是目前亟待解决的问题;在现有技术条件下,要实现海量视频的检索,通常采用后台手动加注和自动生成相关目标低级语义,该方式需要耗费大量的计算量和人力且系统结构复杂,而该方式只能针对部分重点区域或重点时间段视频,不能对系统内所有视频进行语义转换。 

发明内容

本发明的目的就在于克服现有技术存在缺点和不足,提供了一种具有视频语义分析功能的高清网络摄像机。 

本发明的目的是这样实现的: 

将相关图像目标提取算法、目标特征(类别、颜色、大小、运动方向和速度等)分析算法植入到高清网络摄像机中,在视频压缩编码的同时生成视频语义元数据,使摄像机具有目标对象语义提取功能,同时采用基于时戳(ts)的视频数据与视频语义元数据的同步生成和传输方法将视频数据与视频语义元数据同步 传输到后端平台,从而提供一种全新概念的高清网络摄像机,它输出的将不仅仅是一幅幅图像,而且同时还输出图像中被结构化语义描述的目标对象。 

具体技术方案为: 

一、具有视频语义分析功能的高清网络摄像机(简称摄像机) 

本摄像机包括图像采集单元、数字信号处理单元、网络传输单元、FLASH存储单元和DDR数据存储单元; 

图像采集单元包括镜头和图像传感器; 

数字信号处理单元包括语义分析模块和视频编码模块; 

镜头与图像传感器通过结构件实现光连接; 

数字信号处理单元分别与图像传感器、FLASH存储单元、DDR数据存储单元和网络传输单元连接。 

二、视频语义元数据生成及同步传输的方法(简称方法) 

本方法基于上述的具有视频语义功能的高清网络摄像机,包括视频语义元数据生成和同步传输; 

1)视频语义元数据生成: 

①图像采集单元采集原始视频图像通过数模转换后将采集到的原始视频图像序列传输给语义分析模块; 

②语义分析模块接收采集的连续原始视频图像序列; 

③原始视频图像序列缩放到指定处理分辨率352×288; 

④利用缩放后的图像数据初始化背景模型; 

⑤根据背景差分法(背景模型和当前帧的差)检测运动目标,并且更新背景模型; 

⑥对检测出来的运动目标进行形态学处理; 

⑦对处理过的运动目标进行跟踪; 

⑧计算运动目标的特征,特征包括类别(人、车和物)、颜色、大小、运动方向和运动速度; 

⑨提取目标特征后根据目标特征数据字典,实现目标语义数字化。 

2)同步传输: 

①图像采集单元采集原始视频图像,且记录当前图像帧的时间戳,将图像数 据和时间戳传输给视频语义模块和视频编码模块; 

②视频语义模块接收到连续的图像序列,将视频目标进行语义转换,输出其对应特征的特征值; 

③视频编码模块接收到连续的图像序列,进行编码,生成压缩后的H.264视频流; 

④通过时戳实现视频语义元数据与编码数据的对应关系,并将时戳相同的视频数据和语义数据传入同步传输模块; 

⑤同步传输模块采用标准的RTP协议进行流媒体传输,同时通过每帧最后一个RTP分包的包头扩展位封装传入的视频语义元数据,实现视频数据与视频语义元数据的同步传输。 

由此可见,本发明是通过上述流程提供了一种全新概念的高清网络摄像机,它输出的将不仅仅是一幅幅图像,而且同时还输出图像中被结构化语义描述的目标对象(比如人、车、物等目标及其特征),同时很好地解决了视频语义元数据和视频数据的同步生成和传输问题。 

本发明具有以下优点和积极效果: 

①将视频语义分析模块前置,实现单台摄像机的视频语义分析功能,形成实时的全时间段的语义分析,同时将视频语义元数据与视频数据同步传输到后端平台,后端平台在此基础上能实现海量视频的快速检索和定位,节约海量视频目标对象查找过程中的大量人力和物力; 

②很好地解决了视频语义元数据和视频数据的同步生成和传输问题,便于后端平台的存储、目标的查找和准确定位。 

③与采用通过后端平台进行语义转换的方案相比,将计算单元前置,具有成本低的优点,且节约大量服务器资源,具有节能环保的积极作用; 

适用于大规模的高清视频监控应用。 

附图说明

图1为摄像机的结构方框图; 

图2为视频数据与视频语义同步生成流程图; 

图3为视频语义分析模块工作流程图; 

图4为网络同步传输模块工作流程图。 

图中: 

10—图像采集单元; 

11—镜头,12—图像传感器; 

20—数字信号处理单元, 

21—语义分析模块,22—视频编码模块; 

30—网络传输单元,31—网络同步传输模块; 

40—FLASH存储单元; 

50—DDR数据存储单元。 

英译汉: 

RTP:实时传送协议; 

FLASH存储:闪存; 

DDR:双倍速率同步动态随机存储; 

Ts:时戳。 

具体实施方式

下面结合附图和实施例详细说明: 

一、摄像机 

1、总体 

如图1,本摄像机包括图像采集单元10、数字信号处理单元20、网络传输单元30、FLASH存储单元40和DDR数据存储单元50; 

图像采集单元10包括镜头11和图像传感器12; 

数字信号处理单元20包括语义分析模块21和视频编码模块22; 

镜头11与图像传感器12通过结构件实现光连接; 

数字信号处理单元20分别与图像传感器12、FLASH存储单元40、DDR数据存储单元50和网络传输单元30连接。 

工作机理: 

镜头11实现在图像传感器12表面成像,图像传感器12将转换后的原始的高 清视频数字信号传送给数字信号处理单元20。数字信号处理单元20实现视频图像的语义分析和压缩编码并通过网络传输单元30实现网络数据接口交换。FLASH存储单元40和DDR数据存储单元50负责数字信号处理单元20的程序和数据保存。 

2、功能块 

1)图像采集单元10 

(1)镜头11 

镜头11采用安防行业通用的镜头;负责光学系统成像。 

(2)图像传感器12 

图像传感器12采用索尼公司的IMX122等高清图像传感器;负责将光学成像转换为原始的高清视频信号。 

2)数字信号处理单元20 

数字信号处理单元20采用美国TI公司的TMS320DM8168芯片,植入自定义的语义分析模块21和视频编码模块22;负责图像的语义分析和压缩编码。 

如图2,图像采集单元10将采集到的图像序列同时发送给语义分析模块21和视频编码模块22,且同时携带该图像序列的时戳(ts)信息; 

语义分析模块21和视频编码模块22对图像序列进行同步处理,同时输出对应时戳的视频压缩数据和目标对象语义元数据,通过时戳实现视频编码数据和视频语义元数据的同步生成。 

3)网络传输单元30 

网络传输单元30采用ATHEROS公司的AR8033芯片,负责网络电平转换和网络数据接口交换,植入自定义的网络同步传输模块31。 

4)FLASH存储单元40 

FLASH存储单元40采用美国MICRON公司的MT29F2G16芯片;负责数字信号处理单元20的程序保存和基本配置数据的保存。 

5)DDR数据存储单元50 

DDR数据存储单元50采用三星公司K4B1G1646芯片;负责数字信号处理单元20的运行数据的保存。 

二、方法 

1、语义分析模块21 

如图3,语义分析模块21其软件是由依次交互的视频图像缩放211、初始化背景模型212、检测运动目标213、背景模型更新214、运动目标形态学处理215、运动目标跟踪216、计算运动目标特征217和语义化输出算法模块218组成。 

具体地说,语义分析模块21的工作流程是: 

①视频图像缩放211 

将原始视频图像缩放到算法分析所需要的分辨率,即352×288像素; 

②初始化背景模型212 

根据缩放后的前n帧视频图像初始化背景模型,n为整数,5≤n≤20; 

③检测运动目标213 

根据当前的背景模型和当前的图像,进行高斯差分,获得运动目标; 

④背景模型更新214 

利用高斯背景建模方法更新当前的背景模型; 

⑤运动目标形态学处理215 

对检测出来的运动目标进行形态学处理,包括腐蚀膨胀处理,以及连通域标记,从而得到完整的运动目标; 

⑥运动目标跟踪216 

利用最近邻方法对运动目标进行目标的跟踪; 

⑦计算运动目标特征217 

所述的运动目标特征包括目标的类别(人、车和物)、颜色、大小、运动方向和运动速度; 

A、所述目标的类别其计算流程如下: 

a、运用canny算子提取目标图像轮廓; 

b、计算图像轮廓处的梯度方向,将梯度方向分成上、下、左、右四类,分别统计四类方向的总数,记为g(i),0<i<5,i为整数; 

c、分别对g(i)归一化处理,归一化处理后的数据记为x(i),公式为 x(i)=g(i)Σi=14g(i),0<i<5,i为整数; 

d、计算目标的长宽比和占空比,分别记为x(5)和x(6),其中占空比指 目标的实际面积与外接矩形之比; 

e、计算目标轮廓的长度与目标轮廓所包围的面积的比值,记为x(7); 

f、将x(i)组成一个特征向量,并且对特征向量进行归一化处理,归一化后的特征向量记为Y(i),0<i<8,i为整数; 

g、利用支持向量机(简称SVM)对已经计算好的特征向量Y(i),0<i<8,i为整数,进行分类,达到目标分类的目的; 

B、所述目标的颜色其计算流程如下: 

a、将原始的目标图像RGB(红、绿、蓝)数据转换成HSV(色调、饱和度、亮度)数据; 

b、将目标的颜色划分成九类,分别是红、橙、黄、绿、青、蓝、紫、黑、白; 

c、判断目标每个像素的颜色,判断的准则如下: 

d、统计目标中每类颜色对应像素个数之和,将包含像素最多的颜色类别作为目标的最终颜色,判断完成; 

C、所述目标的大小通过目标面积计算得到; 

D、运动方向和运动速度均通过目标跟踪轨迹进行计算得到; 

⑧提取目标特征后根据目标特征数据字典,实现目标语义数字化输出218。 

2、视频编码模块22 

视频编码模块22是一种常用的功能模块,其功能是将图像采集单元10传入的数据通过视频编码算法进行H264编码生成标准H264视频数据。 

3、网络同步传输模块31 

网络同步传输模块31的功能是:摄像机收到流媒体传输请求时,将视频数据和视频语义元数据同步传给网络同步传输模块31,网络同步传输模块31将相 同时戳的视频语义元数据和视频数帧据采用标准RTP方式打包同步发送。 

如图4,网络同步传输模块31的工作流程如下: 

①输入相同时戳的视频语义元数据和视频帧数据-41; 

②读取视频帧数据,生成标准RTP包-42; 

③判断RTP包是否为视频帧最后一个分包,是则进入下一步骤④,否则跳转到步骤⑤; 

判断依据为未发送的视频帧数据长度是否≤N,N为自然数,N<1480,如果是则生成的RTP包为该帧最后一个RTP分包; 

④将视频语义元数据封装在该RTP包的包头扩展位-44; 

⑤发送RTP包数据,完成视频帧数据与视频语义元数据的同步传输-45。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号