跨媒体检索中文本与图像信息融合研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网和多媒体技术以及压缩编码技术的发展，硬件存储能力极大提升，大量的多媒体数据存在网络中；相比于单一媒体，多媒体能提供更多的信息。
　　面对浩瀚的数据海洋，如何准确有效地按照用户的需求找出相关的多媒体数据。现有检索系统广泛存在一个“语义鸿沟”问题，即两幅图像可能在视觉特征上并不相似，但它们却在同一主题之下；或者两幅图像视觉特征部分相似，却表达不同的主题。为了解决语义鸿沟问题，近年来已有许多学者提出跨媒体检索模型，利用现有的文本、图像、视频特征提取算法、特征降维方法，建立融合模型，融合不同媒体之间的特征，试图将多媒体数据的高层语义剥离出来。
　　在特征提取中，由于视频这一媒体在经过场景分割、关键帧提取等过程之后一定程度上相当于图像，而音频经过场景识别、语音识别等过程之后一定程度上相当于文本，因此本文将研究重点放在文本与图像的信息融合中。
　　本文首先介绍了跨媒体检索的发展概述，跨媒体检索的特征提取，包括文本以及图像对于跨媒体检索有贡献的特征提取方法。然后介绍了本文的主要创新工作，两种基于卷积神经网络的跨媒体哈希检索模型，基于词-词相似矩阵的监督哈希跨媒体检索模型和基于余弦距离损失函数的监督哈希跨媒体检索模型，利用深度学习模型和自然语言处理技术，使得文本信息融合到图像检索过程中，完成跨媒体检索任务。
　　本文使用深度学习开源框架Caffe以及自然语言处理工具NLTK进行实验仿真，两种模型将图像卷积特征与文本词向量、词-图对应矩阵作为神经网络的输入,将设计的融合哈希码作为训练目标，将文本与图像同时映射到二进制哈希码中，利用快速哈希检索技术进行检索，两种模型分别设计了融合哈希码和一种损失函数，使得对应文本与对应图像通过神经网络能获得距离相近的哈希码。实验表明，这两种方法能够较好的完成跨媒体中以图搜文、以文搜图的任务。

著录项

作者
赵津锋;
展开▼
作者单位

湘潭大学;

展开▼
授予单位湘潭大学;
学科电子与通信工程
授予学位硕士
导师姓名裴廷睿;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息处理（信息加工）;
关键词
跨媒体; 深度学习; 信息融合; 数据检索; 特征提取;
入库时间 2022-08-17 10:48:29

相似文献

中文文献
外文文献
专利

1. 融合两级相似度的跨媒体图像文本检索 [J] . 李志欣 ,凌锋 ,张灿龙 . 电子学报 . 2021,第002期
2. 图像检索中结合文本信息的多示例原型选择及主动学习策略 [J] . 李净 ,郭洪禹 . 计算机应用 . 2012,第010期
3. 基于文本的图像检索与基于内容的图像检索技术的比较研究 [J] . 阿斯艳·哈米提 ,阿不都热西提·哈米提 . 首都师范大学学报（自然科学版） . 2012,第004期
4. 联合耦合字典学习与图像正则化的跨媒体检索方法 [J] . 刘芸 ,于治楼 ,付强 . 计算机工程 . 2019,第006期
5. 基于跨媒体字典的图像检索 [J] . 顾文娇 ,张化祥 . 计算机工程 . 2014,第006期
6. TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索 [C] . 施水才 ,肖诗斌 ,王弘蔚 . 中国中文信息学会二十周年学术会议 . 2001
7. 基于跨模态图像文本检索的烹饪食谱与食物图像融合研究 [A] . 计楠 . 2019

跨媒体检索中文本与图像信息融合研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅