公开/公告号CN103268263A
专利类型发明专利
公开/公告日2013-08-28
原文格式PDF
申请/专利权人 重庆讯美电子有限公司;
申请/专利号CN201310177001.9
发明设计人 谢剑;
申请日2013-05-14
分类号G06F9/50(20060101);
代理机构重庆中流知识产权代理事务所(普通合伙);
代理人胡长生
地址 400039 重庆市九龙坡区科园一路166号火炬大厦2号楼9层
入库时间 2024-02-19 19:50:28
法律状态公告日
法律状态信息
法律状态
2019-05-14
专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F9/50 变更前: 变更后: 申请日:20130514
专利权人的姓名或者名称、地址的变更
2017-12-15
专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F9/50 变更前: 变更后: 申请日:20130514
专利权人的姓名或者名称、地址的变更
2016-08-10
授权
授权
2014-05-07
著录事项变更 IPC(主分类):G06F9/50 变更前: 变更后: 申请日:20130514
著录事项变更
2013-09-25
实质审查的生效 IPC(主分类):G06F9/50 申请日:20130514
实质审查的生效
2013-08-28
公开
公开
查看全部
技术领域
本发明涉及视频监控领域,尤其涉及一种动态调整多图形处理器负载的方法及系统。
背景技术
近年来,随着数字技术和安防技术的飞速的发展,尤其是网络和高清设备的大量普及,视频数据的处理已经受到越来越多的重视和关注。由于视频数据的巨大,但是很多的图像处理还是使用中央处理器的计算能力来对图像进行处理,虽然近几十年来硬件技术的不断发展导致中央处理器的处理能力飞速上升但是中央处理器对其编解码的处理速度还是远远不能满足现在高端安防行业的需求。就需要对图像处理能力有突出表现得图形处理器来进行图像视频数据的处理。目前,图形处理器已经不再局限于三维图形处理了,图形处理器通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,图形处理器可以提供数十倍乃至于上百倍于中央处理器的性能。
在金融安防行业中越来越多大型监控平台和环境的实际应用中需要涉及到大量的编码和解码运算。在使用图形处理器的运算功能后就会高效的提高视频服务器的运算和处理视频流的能力。
现有的很多视频服务器中有运用到多图形处理器进行多线程任务的方法,参照图1,步骤S101,接收编码数据;步骤102,将所述编码数据按数据帧进行拆分;步骤S103,按照各个图形处理器的序号分配数据帧。
上述方法存在如下问题:分配算法按照相应的编码顺序来进行任务分配,没有完全发挥出多图形处理器的多线程功能;没有对各个图形处理器中的负载进行判定和分析,造成了资源的不充分利用和浪费。
发明内容
本发明要解决的技术问题是提供一种动态调整多图形处理器负载的方法及系统。
为了解决上述技术问题,本发明提供了一种动态调整多图形处理器负载的方法,包括:
接收编码数据,
将所述编码数据按数据帧进行拆分,
收集各个图形处理器的负载情况,
根据所述负载情况,将所述数据帧分配到所述各个图形处理器。
进一步地,将所述各个图形处理器进行负载对比,
将所述数据帧分配给负载最低的图形处理器,
调整所述各个图形处理器的负载均衡。
进一步地,从主机内存中接收待编码视频流,
将所述待编码视频流拆分为帧数据,并放入显存中,
给不同码率或分辨率的帧数据分配不同权值,所述各个图形处理器的负载值为该图形处理器所辖多通道权值相加之和,
根据各个图形处理器的负载权值,将新的编码任务分配给负载权值最低的图形处理器,
各个图形处理器工作在多通道的任务编码中,多个通道同时开始任务时,所有的通道都默认进行数据的抓捕,
第一个通道开始任务时,在时间点进行抓帧后,传送到图形处理器时进行编码,同时第二通道进行抓帧和传送,
第一通道完成编码后,第二通道立即开始编码,同时第三通道进抓帧和数据传送。
本发明还提供了动态调整多图形处理器负载的系统,包括,
所述接收模块,用于接收编码数据,
所述拆分模块,用于将所述编码数据按数据帧进行拆分,
所述收集模块,用于收集各个图形处理器的负载情况,
所述分配模块,用于根据所述负载情况,将所述数据帧分配到所述各个图形处理器。
进一步地,所述分配模块包括对比单元、分配单元和调整单元,
所述对比单元,用于将所述各个图形处理器进行负载对比,
所述分配单元,用于将所述数据帧分配给负载最低的图形处理器,
所述调整单元,用于调整所述各个图形处理器的负载均衡。
由上可知,本发明方法和系统能够达到发挥多图形处理器性能的优势,使各个编码器之间任务均衡分配,节约资源的技术效果。
附图说明
图1是现有技术的方法流程图,
图2是本发明一较佳实施例的方法流程图,
图3是本发明一较佳实施例的系统结构图。
具体实施方式
为使本发明的目的、技术方案、及优点更加清楚明白,下面结合附图对本发明涉及的一种动态调整多图形处理器负载的方法及系统的具体实施实例进行进一步详细描述。
参照图2,图2是本发明一较佳实施例的方法流程图,
步骤S201,接收编码数据,
步骤S202,将所述编码数据按数据帧进行拆分,
步骤S203,收集各个图形处理器的负载情况,
步骤S204,根据所述负载情况,将所述数据帧分配到所述各个图形处理器。
步骤S204具体为:将所述各个图形处理器进行负载对比,将所述数据帧分配给负载最低的图形处理器,调整所述各个图形处理器的负载均衡。
步骤S204还可以具体为:
接收模块从主机内存中接收待编码视频流。
拆分模块将待编码视频流按本身的编码格式拆分为帧数据。并放入显存中。
根据PAL制每秒25帧数据,即编码器40毫秒之内编码完成一帧图像即能保证实时视频的转码。由于编码器编码一帧数据时间远远低于40毫秒,所以为提高编码效率对编码器每40毫秒进行时间分片形成多个编码通道。
收集模块给不同码率或分辨率的帧数据分配不同权值,每个编码器的负载值为该编码器所辖多通道权值相加之和。
分配模块将根据收集器提供的各编码器的负载权值,将新的编码任务分配给负载权值最低的编码器。
每个编码器工作在多通道的任务编码中,多个通道同时开始任务时,所有的通道都默认进行数据的抓捕。
第一个通道开始任务时,在时间点进行抓帧后,传送到编码器时行编码,同时通道第二通道进行抓帧和传送操作。
第一通道完成编码后,第二通道立即开始编码,同时通道第三通道进抓帧和数据传送。
如此往复,每通道抓帧时间点不同,在40ms内完成所有通道的一次编码操作,如使用时间不到40ms,则编码器等待。之后进行下轮编码操作。
参照图3,图3是本发明一较佳实施例的系统结构图,
接收模块10,用于接收编码数据,
拆分模块20,用于将所述编码数据按数据帧进行拆分,
收集模块30,用于收集各个图形处理器的负载情况,
分配模块40,用于根据所述负载情况,将所述数据帧分配到所述各个图形处理器。
分配模块40还包括对比单元、分配单元和调整单元,
对比单元,用于将所述各个图形处理器进行负载对比,
分配单元,用于将所述数据帧分配给负载最低的图形处理器,
调整单元,用于调整所述各个图形处理器的负载均衡。
以上具体实施方式仅用于说明本发明,而非用于限定本发明。
机译: 基于机器人系统的负载输入的动态调整系统和方法
机译: 基于机器人系统的负载输入的动态调整系统和方法
机译: 拖拉机拖车动态负载调整的系统和方法