基于机器学习的图像内容分析与存储方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机的普及以及各种应用平台的高速发展，数据的爆炸式增长对数据分析与存储形成了巨大挑战。针对大规模图像分析应用，存储读取数据时的时间延迟成为制约此项应用的重要问题。图像应用与存储间的语义信息不对称是造成这一问题的根本原因。针对内容语义分析问题，近年来，智能化计算成为主要的研究方向。其中，机器学习因为具有线下学习，线上生成的特点而成为研究热点。针对图像内容语义问题，机器学习能够完成内容语义关联、分类、标注和 Hash映射等任务，为大规模环境下应用图像语义并提升语义分析能力提供算法支持。
　　面向图像的机器学习算法从学习过程上分为浅层学习与深度学习两种。前者需要先通过传统图像分析方法提取特征，然后利用浅层学习的方法完成任务。后者通过卷积神经网络与任务网络进行端到端的学习完成任务。浅层学习由于割裂了特征提取与任务间的关系，从而降低了任务的准确率，进而被深度学习所取代。深度学习能够串联学习特征提取与任务间的逻辑关系，但是由于参数难以设计，其应用广泛性受到制约。针对以上的特点，研究分别以浅层学习与深度学习为基础对图像标注，图像Hash和图像存储展开具体实践。
　　图像标注是图像内容语义分析中的重要议题。标注能够建立起图像内容与语义间的分类关系。为解决标注应用中，单视图特征效果不稳定的问题，算法引入浅层学习机制下的集成学习方式融合多种特征，提出多视图多标签的标注方法MVML。算法使用BOF，VLAD和PHOG三种方法提取特征，以SVM为基础学习器进行集成融合。算法针对平衡样本和非平衡样本的训练数据集提出Bagging和Boosting两种学习方式，并创新性地使用验证集进行基础学习器的权重学习。在 LabelMe和VOC2012数据集上的结果显示， MVML的效果在不同任务下都保持稳定并优于最好的单视图下效果。在与多标签标注算法MKL-SVM的对比中MVML的标注精确率在大部分时候平均高出3.5%。
　　图像标注技术生成的内容语义信息，在大规模环境中的表达能力与比对能力具有局限性。通过0和1构建的相似性Hash因为轻便的表达方式，并且能够通过异或实现快速比对而成为替代方案。利用深度学习实现相似性 Hash映射，能够提升映射前的特征相关性，但是需要解决没有Hash标签，无法进行有监督学习的问题。因此，在深度学习机制下提出一套自学习图像相似性Hash生成算法DSTH。DSTH分为标签获得与函数学习两个阶段。第一阶段中，利用国际优秀模型迁移学习得到深度特征，构建K近邻图结构，通过拉普拉斯特征值降维与二值化获取Hash标签。第二阶段中，以切片网络构建函数学习网络，使用BatchNorm作为激活函数，在欧式距离损失函数下，映射每个维度上的Hash值。实验对比了不同深度特征、函数学习网络和激活函数配置下的效果，发现通过GoogLeNet得到深度特征配合切片网络和BatchNorm激活函数能够得到更好的效果。在此方案下，实验以CIFAR-10数据集下48位和STL-10数据集下32位的Hash码，在使用分类标签和不使用分类标签情况下分别对比了其他有监督Hash算法和无监督Hash算法。结果显示DSTH在召回率精确率和按数量返回图像精确率的对比中全面占优，在按汉明距离返回精确率和按最近类别返回的码长分析中部分占优，证明 DSTH生成的Hash码具有较强的近似表达能力。最后，实验利用CIFAR-100数据集相同数据不同类别的特性进行DSTH泛化表达能力测试，通过无标签学习结果验证不同分类标准下的性能。结果发现在最近3类查找精确率上差异微小，证明DSTH具有较强的泛化表达能力。
　　为解决大规模图像分析时需要提取大量数据的问题，设计提出面向图像内容的图谱化存储系统方案。结合DSTH工作，方案引入深度学习，相似性 Hash和图谱化元数据。通过深度学习得到 Hash语义元数据增补元数据，并以图谱化结构构建和管理语义元数据。另外，根据图结构特点，通过改进 PageRank算法，提出以汉明距离为度量的SemRank节点排名算法。实验结果证明了算法的有效性与可靠性。在图检索应用实验中，证明算法能够得到时事热点，并以语义渐变方式引导用户关注热点。最后，实验通过节点在图数据库中的插入时间趋势，证明设计方案能够适用于大规模环境，为存储与应用分析搭建内容语义桥梁。

著录项

作者
刘渝;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科计算机系统结构
授予学位博士
导师姓名周可,邹复好;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;模式识别与装置;
关键词
内容语义; 机器学习; 图像标注; 相似性Hash; 图谱化元数据;

相似文献

中文文献
外文文献
专利

1. 基于机器学习的日冕仪图像分类方法研究 [J] . 单家辉 ,封莉 ,袁汉青 . 天文学报 . 2020,第004期
2. 基于机器学习的模糊图像边缘轮廓三维重建方法研究 [J] . 刘鑫 ,曾铭钰 ,段幼春 . 电子测试 . 2019,第017期
3. 基于机器学习的SAR图像目标识别方法研究 [J] . 徐东 ,杨健 ,徐亚范 . 微电子学与计算机 . 2004,第7期
4. 基于双DSP的雷场侦察图像实时压缩及存储方法研究 [J] . 周新建 ,张国进 ,高攀 . 国外电子元器件 . 2006,第007期
5. 基于硬盘的数字图像高速存储方法研究 [J] . 刘智 ,张赤军 . 长春理工大学学报（自然科学版） . 2002,第001期
6. 基于机器学习的超声图像识别技术进展与应用 [C] . Ji Huang ,黄骥 . 2019中国医学装备大会 . 2019
7. 基于视觉特征与机器学习的图像分类和图像检索方法研究 [A] . 王博 . 2015

基于机器学习的图像内容分析与存储方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅