公开/公告号CN114885080A
专利类型发明专利
公开/公告日2022-08-09
原文格式PDF
申请/专利权人 北京元智东方科技有限公司;
申请/专利号CN202210457837.3
发明设计人 柯春林;
申请日2022-04-27
分类号H04N5/225(2006.01);H04N5/262(2006.01);H04N5/265(2006.01);H04N5/232(2006.01);F16M11/42(2006.01);F16M11/08(2006.01);F16M11/18(2006.01);G01D21/02(2006.01);
代理机构
代理人
地址 102488 北京市房山区拱辰街道月华大街1号A8-1710
入库时间 2023-06-19 16:19:08
法律状态公告日
法律状态信息
法律状态
2022-11-15
实质审查的生效 IPC(主分类):H04N 5/225 专利申请号:2022104578373 申请日:20220427
实质审查的生效
2022-08-09
公开
发明专利申请公布
技术领域
本发明涉及短视频拍摄技术领域,特别涉及智能短视频vlog生成装置及生成系统。
背景技术
vlog是一种视频形式,可以有两种定义:一种是“video log-视频日志”,另一种定义成“video of log-日志视频”,区别在于前面一种定义的重心是日志,本质上和文字日记,图片日记是一个形式,是用视频的形式承载日志的内容;而后一种定义则是更在意视频,日志内容为视频服务,vlog只是众多风格视频其中的一款形式,以日常记录为内容的视频;
目前市面上的自动短视频(vlog)生成方案,多为在景区、游乐场、体育场馆等场景下,对游客活动行为进行捕捉拍摄,后续使用用户镜头及固定的视频素材,再通过模版规则将视频素材及用户镜头进行合并拼接生成游客自动短视频(vlog);
在游客镜头拍摄阶段,多为固定摄像头,游客经过时,进行捕捉,但固定摄像头存在拍摄取景框固定的问题,无法加入拍摄“运镜”等技术,导致拍摄出来的视频镜头内容单一,而针对运动场景,取景框的大小也限制了整个运动的范围;在视频生成阶段,目前都为固定视频模板方案,只有存粹的素材拼接,整体vlog的连贯性,整体的协调性难以保证;为此,我们提出智能短视频vlog生成装置及生成系统。
发明内容
本发明的主要目的在于提供智能短视频vlog生成装置及生成系统,以解决上述背景中提出的问题。
为实现上述目的,本发明采取的技术方案为:智能短视频vlog生成系统,包括镜头拍摄单元、拍摄镜头检索单元和镜头生成单元,所述镜头拍摄单元包括旋转底座模块、运动滑轨模块和运动传感交互模块,所述旋转底座模块通过设定整个底座旋转的速度或加速度整个运动的轨迹,实现“运镜”效果,所述运动滑轨模块进行多个纬度的运动合成,实现拍摄特效,所述运动传感交互模块通过摄像装置对空间位置信息、运动信息及拍摄数据信息进行采集,并将数据传输到服务中台;
所述拍摄镜头检索单元包括人脸信息检索模块和rfid/蓝牙标签信息检索模块,所述人脸信息检索模块通过对用户人脸信息进行编码,将编码向量与人脸信息库中向量数据进行匹配,取top1作为检索结果,所述rfid/蓝牙标签信息检索模块采用rfid标签或蓝牙标签进行识别,将标签贴在人或物体身上,人物信息与标签进行绑定;
所述镜头生成单元包括视频追踪特效模块和自动模版模块,所述视频追踪特效模块使用深度学习技术,对取景框内视频进行动态裁剪固定大小的区域,达到视觉上的追踪效果,所述自动模版模块将整个vlog按电影的场次形式做拆分,并将场次的素材与镜头进行拼接来生成vlog。
所述运动传感交互模块,通过服务后台对数据实时分析,并进行反馈,进而整个运动装置发布指令,对运动进行调整。
所述人脸信息检索模块包括摄像阶段和拍摄镜头检索阶段,所述摄像阶段利用摄像装置采集并对视频进行分析,通过人脸检测,对拍摄镜头基于人脸信息进行分类,同时将人脸信息进行向量编码存储,与拍摄镜头进行绑定。
所述rfid/蓝牙标签信息检索模块中,人物接近信号接收器时,接收器接收到标签的信息及距离信息,通过最近的距离信息确定人物经过接收器的时间,将此时间与摄像装置拍摄时间进行对应,从而将摄像装置采集到的视频与人物进行绑定。
智能短视频vlog生成装置,包括底座,所述底座底端连接有底盘,所述底盘内部连接有步进电机,所述步进电机的输出端与底座连接,所述底盘底端螺纹连接有若干支撑垫,所述底座表面设置有滑轨,所述底座上端安装有安装架,所述安装架底端连接有滑块,所述滑块与滑轨位置相适应,且所述滑块与滑轨滑动配合,所述安装架顶端安装有上壳体,所述上壳体表面连接有摄像机,所述摄像机一端连接有摄像头,所述摄像头的拍摄方向与底座位置相适应,所述安装架侧表面连接有下壳体,所述下壳体位于上壳体下方,所述下壳体内部分别设置有wifi通讯模块和蓝牙通讯模块,所述wifi通讯模块和蓝牙通讯模块均与摄像机通信连接,所述摄像机外侧安装有补光灯,所述补光灯与安装架连接。
所述上壳体内部分别安装有人体热传感器、陀螺仪传感器、速度传感器和加速度传感器,所述人体热传感器、陀螺仪传感器、速度传感器和加速度传感器均与摄像机电性连接,操作自适应力强。
所述底座周侧面螺纹连接有提手,便于对设备进行搬运。
所述安装架顶端连接有连接件,所述上壳体底端与连接件连接,连接件对上壳体进行固定。
所述安装架为伸缩结构,调节拍摄装置的使用高度。
本发明具有如下有益效果:
一,本发明智能短视频vlog生成装置,通过设置运动旋转底座,其内置数控步进电机,通过设定整个底座旋转的速度/加速度整个运动的轨迹,实现特定的“运镜”,在运动旋转底座上,可安装不同类型的滑轨,摄像设备安装在运动滑轨之上,整个拍摄系统在运动旋转底座的基础上,配置运动滑轨,可实现多个纬度的运动合成,实现各种拍摄特效。
二,本发明智能短视频vlog生成装置,在摄像装置上,同时配置人体热传感、陀螺仪传感、速度传感、加速度传感等传感器,可实现对摄像装置对空间位置信息、运动信息及拍摄数据信息进行采集,并且整个装置配备wifi、蓝牙等通讯模块,支持将整个数据传输到服务中台,服务后台可对数据实时分析,并进行反馈,进而整个运动装置发布指令,对运动进行调整,操作快捷。
三,本发明智能短视频vlog生成系统,将整个vlog按电影的场次形式做拆分,每一个场有一定的场景条件,在特定的场景条件下,可以拍摄不同的素材视频,这些素材视频可以随意替换,并且此方案下,可大大扩展生成vlog的多样性。
附图说明
图1为本发明智能短视频vlog生成装置的整体结构示意图;
图2为本发明智能短视频vlog生成装置的主视结构示意图;
图3为本发明智能短视频vlog生成装置的图2中A-A面的剖视图;
图4为本发明智能短视频vlog生成装置的底面结构示意图;
图5为本发明智能短视频vlog生成装置的图1中A处的局部放大图;
图6为本发明智能短视频vlog生成系统的操作架构图。
图中:1、底座;2、底盘;3、支撑垫;4、步进电机;5、提手;6、安装架;7、滑块;8、滑轨;9、补光灯;10、连接件;11、上壳体;12、摄像机;13、摄像头;14、人体热传感器;15、陀螺仪传感器;16、速度传感器;17、加速度传感器;18、下壳体;19、wifi通讯模块;20、蓝牙通讯模块。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例一:
请参照图6所示:智能短视频vlog生成系统,包括镜头拍摄单元、拍摄镜头检索单元和镜头生成单元,镜头拍摄单元包括旋转底座模块、运动滑轨模块和运动传感交互模块,旋转底座模块内置数控步进电机,通过设定整个底座旋转的速度或加速度整个运动的轨迹,实现“运镜”效果,运动滑轨模块在运动旋转底座上,可安装不同类型的滑轨,摄像设备安装在运动滑轨之上,此运动滑轨同样支持运动设定,整个拍摄系统在运动旋转底座的基础上,配置运动滑轨,可实现多个纬度的运动合成,实现各种拍摄特效,运动传感交互模块通过摄像装置对空间位置信息、运动信息及拍摄数据信息进行采集,并将数据传输到服务中台;
拍摄镜头检索单元包括人脸信息检索模块和rfid/蓝牙标签信息检索模块,人脸信息检索模块通过对用户人脸信息进行编码,将编码向量与人脸信息库中向量数据进行匹配,取top1作为检索结果,rfid/蓝牙标签信息检索模块采用rfid标签或蓝牙标签进行识别,将标签贴在人或物体身上,人物信息与标签进行绑定;
镜头生成单元包括视频追踪特效模块和自动模版模块,视频追踪特效模块中,固定取景框下的视频追踪特效,采用高分辨率的摄像装置,使用深度学习等技术,对取景框内视频进行动态裁剪固定大小的区域,以达到视觉上的追踪效果,整个流程分为3部分,首先对原视频切帧处理,单帧图片经过目标检测模型,检测图像中指定物体区域,得到物体的边界框信息,第二步,对所有视频图片中物体对边界框信息进行分析调整,以物体对边界框中心点为基准,对所有图片中物体对中心点进行曲线拟合,使得整个中心点轨迹平滑,第三步,在时间纬度上选取关键帧,关键帧之间使用匀速运动进行近似处理,生成完整的运动中心点信息,最后基于中心点位置,从原图像大小上截取固定大小的图像,将所有图像聚合成最终输出的视频,最终生成的视频即可在视觉上实现追踪效果,自动模版模块中,将整个vlog按电影的场次形式做拆分,可以分成多个“场”,其中用户的不同镜头也是一个单独的“场”,场与场之间存在时间线关系,在时间线的基础上,可以在总“场”中任意的排列组合去选出特定数量的场次,将这些场次的素材与镜头进行拼接来生成vlog,每一个场有一定的场景条件,在特定的场景条件下,可以拍摄不同的素材视频,这些素材视频可以随意替换,在这个方案下,可以大大扩展生成vlog的多样性。
运动传感交互模块,在摄像装置上,同时配置、人体热传感、陀螺仪传感、速度传感、加速度传感、等传感器,可实现对摄像装置对空间位置信息、运动信息及拍摄数据信息进行采集,并且整个装置配备wifi、蓝牙等通讯模块,支持将整个数据传输到服务中台,服务后台可对数据实时分析,并进行反馈,进而整个运动装置发布指令,对运动进行调整。
人脸信息检索模块包括摄像阶段和拍摄镜头检索阶段,在摄像阶段,对摄像装置采集到对视频进行分析,进行人脸检测,并对拍摄镜头基于人脸信息进行分类,同时将人脸信息进行向量编码存储,并与拍摄镜头进行绑定。在拍摄镜头检索阶段,用户上传人脸信息,对用户人脸信息进行编码,将编码向量与人脸信息库中向量数据进行匹配,取top1近似,作为检索结果。
rfid/蓝牙标签信息检索模块中,在运动场景下,当人经过摄像采集装置时,由于人身上存在头盔等保护装置导致面部信息被遮挡,难以使用人脸信息进行识别的时候,可以采用rfid标签或蓝牙标签进行识别,标签系统由接收器与标签组成,将标签贴在人或物体身上。人物信息即可与标签进行绑定,当人物接近信号接收器的时候,接收器可接收到标签的信息及距离信息,通过最近的距离信息可近似确定人物经过接收器的时间,将此时间与摄像装置拍摄时间进行对应,即可将摄像装置采集到的视频与人物进行绑定。
实施例二:
请参照图1-图5所示:智能短视频vlog生成装置,包括底座1,底座1底端连接有底盘2,底盘2内部连接有步进电机4,步进电机4的输出端与底座1连接,底盘2底端螺纹连接有若干支撑垫3,底座1表面设置有滑轨8,底座1上端安装有安装架6,安装架6底端连接有滑块7,滑块7与滑轨8位置相适应,且滑块7与滑轨8滑动配合,安装架6顶端安装有上壳体11,上壳体11表面连接有摄像机12,摄像机12一端连接有摄像头13,摄像头13的拍摄方向与底座1位置相适应,安装架6侧表面连接有下壳体18,下壳体18位于上壳体11下方,下壳体18内部分别设置有wifi通讯模块19和蓝牙通讯模块20,wifi通讯模块19和蓝牙通讯模块20均与摄像机12通信连接,摄像机12外侧安装有补光灯9,补光灯9与安装架6连接,增强拍摄效果;
上壳体11内部分别安装有人体热传感器14、陀螺仪传感器15、速度传感器16和加速度传感器17,人体热传感器14、陀螺仪传感器15、速度传感器16和加速度传感器17均与摄像机12电性连接,操作自动化程度高;底座1周侧面螺纹连接有提手5,便于进行搬运;安装架6顶端连接有连接件10,上壳体11底端与连接件10连接,对上壳体11进行连接固定;安装架6为伸缩结构,调节拍摄装置的使用高度。
本方案中,通过设置运动旋转底座1,其内置数控步进电机4,通过设定整个底座1旋转的速度/加速度整个运动的轨迹,实现特定的“运镜”,在运动旋转底座1上,可安装不同类型的滑轨8,摄像设备安装在运动滑轨8之上,整个拍摄系统在运动旋转底座1的基础上,配置运动滑轨8,可实现多个纬度的运动合成,实现各种拍摄特效;
在摄像装置上,同时配置人体热传感器14、陀螺仪传感器15、速度传感器16、加速度传感器17,可实现对摄像装置对空间位置信息、运动信息及拍摄数据信息进行采集,并且整个装置配备wifi通讯模块19和蓝牙通讯模块20,支持将整个数据传输到服务中台,服务后台可对数据实时分析,并进行反馈,进而整个运动装置发布指令,对运动进行调整,操作快捷。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
机译: 自动化音乐创作和生成系统,自动化音乐创作和生成过程,自动化音乐创作和生成,玩具乐器,音乐伴奏和音乐创作玩具乐器,自动化创作玩具乐器系统和音乐生成,电子信息处理和显示系统,企业基于互联网的一流音乐创作和生成系统,用于自动生成和传送数字复合音乐的网络系统,用于音乐环境的基于独立音乐的音乐创作和表演系统人工智能,基于音乐的自主创作过程音乐的生成和表演人工智能,自主分析仪器系统,用于建立自动音乐创作和生成引擎的网络,几何方法音乐理论系统操作参数映射,以自动方式构成和生成数字音乐的方法,参数转换
机译: 用于压缩和解压缩彩色数字视频数据的视频电信系统和方法技术领域本发明涉及一种用于压缩电信系统视频中数字彩色视频数据的方法,该方法具有用于生成视频信号的装置,该装置是用于生成视频信号的装置。将视频信号转换为多个彩色视频帧速率,每个帧图像由多个扫描线组成,扫描线由多个像素组成,图像中的每个像素由彩色数字分量组成(该方法包括确定功能的步骤);基于彩色数字(b)的三个分量中的至少一个的亮度像素,基于两个像素之间的亮度差异,针对当前图像表的扫描线中的至少大部分像素,确定至少一个参数决策。与每条扫描线中至少一个像素相距预定距离的像素,以及至少(c)比较决策参数与
机译: 数字媒体内容提取系统,课程生成和演示,数字媒体内容提取和课程生成系统,视频传输及相关的音频或文本通道分析系统以及基于从通道中提取的数据的自动运动生成学习以及用于视频流分析和分析的系统根据从视频流中提取的数据自动生成课程