首页> 中国专利> 基于目标空间语义对齐的视频描述方法

基于目标空间语义对齐的视频描述方法

摘要

本发明公开了基于目标空间语义对齐的视频描述方法。本发明方法首先对含文本描述的采样视频帧提取外观特征和动作特征,将其拼接后输入到时序高斯混合空洞卷积编码器获得时序高斯特征;然后利用两层长短时记忆神经网络构建解码器,得到生成语句概率分布和隐藏向量;再建立语义重构网络并计算语义重构损失;利用随机梯度下降算法优化模型,对新视频依次通过上述步骤获得生成语句概率分布,用贪心搜索算法获得视频描述语句。本发明方法利用时序高斯混合空洞卷积对视频长期时序关系进行建模,并通过语义重构网络获得语句级的概率分布差异,能够缩小生成语句和视频内容的语义鸿沟,从而生成更准确描述视频内容的自然语句。

著录项

  • 公开/公告号CN114154016A

    专利类型发明专利

  • 公开/公告日2022-03-08

    原文格式PDF

  • 申请/专利权人 杭州电子科技大学;

    申请/专利号CN202111404350.0

  • 发明设计人 李平;王涛;李佳晖;徐向华;

    申请日2021-11-24

  • 分类号G06F16/78(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构33240 杭州君度专利代理事务所(特殊普通合伙);

  • 代理人陈炜

  • 地址 310018 浙江省杭州市下沙高教园区2号大街

  • 入库时间 2023-06-19 14:26:44

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-08

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号