首页> 中文学位 >基于视听信息的人体行为识别算法研究
【6h】

基于视听信息的人体行为识别算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景与意义

1.2 基于视觉信息的行为识别算法研究现状

1.2.1 动作的空间表示方法

1.2.2 动作的时间表示方法

1.3 基于视觉信息的人体行为识别算法存在的问题

1.4 本文主要工作

1.5 章节安排

第二章 基于视觉信息的人体行为识别算法研究

2.1 基于全局特征的人体行为模型

2.1.1 基于人体模型的动作表示方法

2.1.2 基于图像模型的动作表示方法

2.2 基于局部特征的人体行为表示

2.2.1 常用的人的行为识别时空兴趣点检测子

2.2.2 常用的人的行为识别描述子

2.2.3 基于局部特征的人的行为识别中特征提取与描述趋势

2.3 基于局部特征的人的行为表示与识别方法

2.3.1 基于局部特征的人的行为表示方法

2.3.2 基于局部特征的人的行为识别方法

2.4 常用的动作数据集

2.4.1 KTH动作数据集

2.4.2 Weizmann动作数据集

2.4.3 IXMAS动作数据集

2.4.4 UCF体育运动动作数据集

2.4.5 HOHA动作数据集

2.4.6 YouTube数据集

2.4.7 其他动作数据集

2.5 本章小结

第三章 基于视觉局部特征的人体行为识别

3.1 3D Harris检测子

3.2 3D SIFT描述子

3.3 基于词包模型的人体行为表示

3.4 基于在线序贯极速学习机的人体行为识别算法

3.4.1 算法原理

3.4.2 算法实现

3.5 实验结果与分析

3.5.1 对人的在线学习能力

3.5.2 对人的记忆能力

3.5.3 对场景的在线学习能力

3.5.4 对场景的记忆能力

3.6 本章小结

第四章 基于多模型的人体行为识别算法

4.1 相关研究工作

4.2 视觉信息和运动信息特征提取

4.2.1 视觉信息特征提取

4.2.2 兴趣点筛选

4.2.3 运动信息特征提取

4.3 音频特征提取

4.3.1 频谱域特征

4.3.2 时间域特征

4.4 视觉、运动和音频特征融合

4.4.1 信号增强和传感器层融合

4.4.2 特征层融合

4.4.3 分类层融合

4.4.4 决策层融合

4.4.5 语义层融合

4.4.6 混合融合

4.5 实验结果与分析

4.5.1 实验设置

4.5.2 实验结果

4.5.3 实验结果分析

4.6 免疫多克隆极限学习机

4.6.1 问题提出

4.6.2 相关研究工作

4.6.3 免疫多克隆算法

4.6.4 基于免疫多克隆算法优化极限学习机

4.6.5 实验结果与分析

4.7 本章小结

第五章 总结和展望

5.1 全文总结

5.2 展望

参考文献

致谢

攻读硕士学位期间的学术成果

展开▼

摘要

人体行为识别是计算机视觉中一个非常活跃的研究课题,在人机交互、基于内容的视频索引、视频监控以及机器人学等方面有着潜在的经济和社会价值,得到了广大科研工作者的高度关注。关键问题是如何从信息量巨大的视频图像中提取有效特征,即如何利用一种简单快速有效的模型来表示人体的不同行为,实现在复杂自然环境中的人体行为识别任务,并能同时满足实时性和鲁棒性的要求。
   本论文主要研究了基于视觉信息和基于视听信息的人体行为识别算法,在有效的视听特征提取和描述基础上,应用先进的智能算法对人体行为进行识别,完成的主要工作如下:
   首先,分析了人体行为识别问题的研究背景和意义,综述了目前基于视觉信息的人体行为识别问题的国内外研究现状以及存在的主要问题,简单介绍了本论文的主要内容和章节框架。
   第二,简单分析了目前已有的基于视觉信息的人体行为特征提取、描述方法,人体行为表示模型,并介绍了人体行为识别研究常用的动作数据集。
   第三,研究了背景简单、无遮挡情况下的人体行为识别问题,在分析比较各种视觉检测子和描述子基础上,利用3D Harris时空角点检测子提取KTH视频序列中三维角点,采用3D SIFT描述子对时空兴趣点进行描述生成特征向量,建立词包模型,提出利用在线极限学习机在线学习并分类人体的各种行为,在线极限学习机、极限学习机以及状态向量机的比较实验结果表明,在线极限学习机分类器具有出色的对人和场景的记忆功能,在线极限学习机的在线学习能力可有效提高识别率。
   第四,进一步研究了复杂动态背景、存在遮挡情况下的人体行为识别问题,研究了融合视频中的视觉、音频、运动信息,进行人体行为识别。对于视觉信息,利用Cuboid检测子提取视频中兴趣点块,对每个兴趣点块计算LBP-TOP描述子;对于运动信息,利用Tracklet描述子跟踪检测视频中人体运动信息并加以描述;对于音频信息,提取视频中14种频谱域和时间域的音频特征。然后,应用特征层融合、决策层融合和混合融合方法在HOHA数据集和YouTube数据集中对提取的三种特征进行融合识别复杂动态背景下人体行为。通过实验证明了融合三种不同的特征:视觉、运动和音频特征能在背景复杂动态环境下比较准确地识别人体各种行为。最后,提出了基于免疫多克隆优化算法的ELM分类器,利用免疫多克隆算法的抗体多样性提高全局搜索能力,在隐层神经元个数一定的情况下,搜索使得ELM分类器泛化性能最优的输入权重和偏置,实验结果验证了该改进的ELM分类器能够获得更高的分类精度。
   最后,对本论文所做工作进行总结,并提出了下一步的研究方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号