首页> 中文学位 >基于语义结构和视觉焦点的场景目标识别
【6h】

基于语义结构和视觉焦点的场景目标识别

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1. 绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.3 主要研究内容及结构安排

2. Gist+滤波器组构成的特征向量

2.1 图像直方图基础

2.2 LAB空间变换基础

2.3 图像滤波基础

2.4 Gist+滤波器组生成的特征向量提取

2.5本章小结

3. 改进的视觉注意力焦点模型

3.1传统的ITTI模型

3.2 MeanShift+ITTI模型

3.3 视觉焦点+ITTI模型

3.4各种算子定位结果比较

3.5本章小结

4. 语义机制改进的机器学习

4.1可支持向量机SVM

4.2 Libsvm和Liblinear

4.3场景语义机制的SVM

4.4本章小结

5.基于语义结构和视觉焦点的目标识别算法实现

5.1 实验环境描述

5.2 算法步骤流程

5.3 实验仿真结果及分析

5.4 本章小结

6. 总结与展望

6.1 工作总结

6.2 工作展望

参考文献

攻读硕士期间发表的论文及所取得的研究成果

致谢

展开▼

摘要

复杂场景中的目标检测以及识别一直都是机器视觉、人工智能、模式识别和图像处理领域的热点研究技术之一,并且被广泛的应用在军事科技、工业安防、日常生活、医疗气象等各个方面。像目前发展迅速的 Google和百度的无人车、大疆创新开发的无人机、爱奇艺的视频广告投放、高新兴科技的智慧城市以及Magic Leap技术等,这些目标检测识别的应用与我们的生活如影随形。因此,提高复杂场景中目标的识别率和实时性就具有非常重要的意义。
  本文所做的改进工作主要包括以下两个方面。
  首先,经典的脉冲耦合神经网络(PCNN)+ITTI模型值虽然可以确定整个场景的目标物体,但是分离而出的目标物体中还会将背景图像也分离进去,并且无法将单个目标分别分离而出,因此会对后续要提取的特征向量有较大的影响,严重的影响了识别率。改进的MeanShift+ITTI模型,可以将整个目标分离而出,并且只带有少量的背景信息,实现了很好的目标物的分离,但是同样无法实现将多目标场景的分离。因此,本文提出了基于视觉焦点的改进 ITTI模型,可以实现多目标复杂场景的目标物体分离,同时对于目标物与目标物之间的遮挡、粘连情况也具有较好的识别效果。
  其次,本文提出了将自然语言处理中的的语义机制应用于SVM分类器模型中,对于SVM分类不满足自然场景语义机制的打分,选取打分次高者作为判断的类别,并以此类推,使得重新进行目标识别后可以给出满足自然场景语义机制的识别结果,并且在时间上只有稍微的延时,同时,对识别率有了一定的提升。
  综上所述,本文提出的基于语义结构和视觉焦点的复杂场景目标检测识别技术具有自适应性好、识别率高、实时性好等特点。有望被各种目标识别技术应用和借鉴。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号