基于语义相似性的跨模态图文内容筛选存储机制研究

刘渝; 郭婵; 冯树耀; 周可; 肖志立

首页> 中文期刊>计算机研究与发展 >基于语义相似性的跨模态图文内容筛选存储机制研究

基于语义相似性的跨模态图文内容筛选存储机制研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着多媒体数据的爆发式增长,云端数据呈现出大规模多模态混合并存的特性.服务于数据分析的传统存储系统因为缺乏数据的语义管理而面临读取延时超长的挑战.针对图像和文本2种模态数据,在传统存储系统之上提出一种跨模态图文数据内容筛选存储机制(cross-modal image and text content sifting storage,CITCSS),用于提供大规模在线相似性内容筛选服务,从存储系统层面缓解数据分析时必须从存储中读出所有数据的读带宽压力机制分为离线与在线2个阶段.离线阶段中,引入基于自监督的生成对抗式Hash方法,系统利用这种方法生成语义元数据.然后,将元数据注入独立的元数据空间最后,根据相似性Hash码间汉明距离能够度量语义距离的特点,利用Neo4j图数据库构建Hash元数据图谱,并在语义图谱中建立Hash码与存储路径之间的映射在线阶段中,用户发送与分析相关的图像或文本,存储系统首先转化数据为Hash码然后,在筛选半径内通过Hash元数据图谱寻找相似节点,进而找到相似文件的底层存储路径返回筛选数据.实验结果表明,与传统语义存储系统相比,CITCSS在召回率超过98％的性能下,读取延迟相对降低了99.07％～99.77％.

著录项

来源
《计算机研究与发展》|2021年第2期|338-355|共18页
作者
刘渝; 郭婵; 冯树耀; 周可; 肖志立;
展开▼
作者单位

华中科技大学武汉光电国家研究中心武汉430074;

华中科技大学武汉光电国家研究中心武汉430074;

华中科技大学武汉光电国家研究中心武汉430074;

深圳市腾讯计算机系统有限公司技术工程事业群广东深圳518054;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语义管理; Hash码元数据; 元数据图谱; 存储机制; 读带宽;

相似文献

中文文献
外文文献
专利

1. 基于语义相似性的跨模态图文内容筛选存储机制研究 [J] . 刘渝 ,郭婵 ,冯树耀 . 计算机研究与发展 . 2021,第002期
2. 基于深度监督的跨模态图文检索方法研究 [J] . 焦隆 ,徐慧铭 ,程海 . 黑龙江大学自然科学学报 . 2021,第002期
3. 基于注意力机制的TAI-CNN图文跨模态情感分类方法 [J] . 陈小敏 ,许华虎 ,方迪恺 . 计算机应用与软件 . 2021,第005期
4. 一种基于图文融合的跨模态社交媒体情感分析方法 [J] . 申自强 . 软件导刊 . 2019,第001期
5. 一种基于图文融合的跨模态社交媒体情感分析方法 [J] . 申自强1 . 软件导刊 . 2019,第001期
6. 基于内容和语义相似性的文献网络构建方法的比较与评价 [C] . 潘现伟 ,崔雷 . 中国图书馆学会2017年会 . 2017
7. 基于深度哈希学习的图文跨模态检索研究 [A] . 田薪 . 2020

基于语义相似性的跨模态图文内容筛选存储机制研究

摘要

著录项

相似文献

相关主题

期刊订阅