以文字为中心的图像理解技术综述

张言; 李强; 申化文; 曾港艳; 周宇; 马灿; 张远; 王伟平

首页> 中文期刊> 《中国图象图形学报》 >以文字为中心的图像理解技术综述

以文字为中心的图像理解技术综述

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文字广泛存在于各种文档图像和自然场景图像之中,蕴含着丰富且关键的语义信息。随着深度学习的发展,研究者不再满足于只获得图像中的文字内容,而更加关注图像中文字的理解,故以文字为中心的图像理解技术受到越来越多的关注。该技术旨在利用文字、视觉物体等多模态信息对文字图像进行充分理解,是计算机视觉和自然语言处理领域的一个交叉研究方向,具有十分重要的实际意义。本文主要对具有代表性的以文字为中心的图像理解任务进行综述,并按照理解认知程度,将以文字为中心的图像理解任务划分为两类,第1类仅要求模型具备抽取信息的能力,第2类不仅要求模型具备抽取信息的能力,而且要求模型具备一定的分析和推理能力。本文梳理了以文字为中心的图像理解任务所涉及的数据集、评价指标和经典方法,并进行对比分析,提出了相关工作中存在的问题和未来发展趋势,希望能够为后续相关研究提供参考。

著录项

来源
《中国图象图形学报》 |2023年第8期|2253-2275|共23页
作者
张言; 李强; 申化文; 曾港艳; 周宇; 马灿; 张远; 王伟平;
展开▼
作者单位

中国科学院信息工程研究所;

北京100093;

中国科学院大学网络空间安全学院;

北京101408;

中国传媒大学媒体融合与传播国家重点实验室;

北京100024;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
文字图像理解; 视觉信息抽取; 场景文字图像检索; 文档视觉回答; 场景文字视觉问答; 场景文字图像描述;

相似文献

中文文献
外文文献
专利

1. 基于单目视觉的道路图像理解综述 [J] . 陈芬 . 电脑知识与技术 . 2015,第23期
2. 基于单目视觉的道路图像理解综述 [J] . 孟丽霞 ,孙富春 ,邵宇 . 计算机应用 . 2010,第6期
3. 中国电子技术标准化研究院信息技术研究中心荣获“国家通用语言文字推广普及先进集体”称号 [J] . . 信息技术与标准化 . 2023,第7期
4. 中美日韩德图像理解技术发展比较——基于DII数据库的实证分析 [J] . 陈玮 ,钟书华 . 世界科技研究与发展 . 2021,第4期
5. 图像理解技术在交通视频分析中的应用研究 [J] . 郝林倩 ,黄金凤 . 电脑编程技巧与维护 . 2018,第3期
6. 动态图像理解在智能交通监控技术上的应用 [C] . 汤一平 ,严海东 ,柳圣军 . 2007年全国模式识别学术会议 . 2007
7. 徐州汉代刻石文字书法综述 [A] . 刘丛 . 2015

以文字为中心的图像理解技术综述

摘要

著录项

相似文献

相关主题

期刊订阅