您现在的位置: 首页> 研究主题> 图像标注

图像标注

图像标注的相关文献在2002年到2023年内共计632篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播 等领域,其中期刊论文168篇、会议论文4篇、专利文献291922篇;相关期刊100种,包括电子学报、计算机工程、计算机工程与科学等; 相关会议4种,包括第十九届网络新技术与应用年会、中国社会科学情报学会2012年学术年会、第十届全国信号和智能信息处理与应用学术会议等;图像标注的相关文献由1633位作者贡献,包括周铭柯、朱松豪、柯逍等。

图像标注—发文量

期刊论文>

论文:168 占比:0.06%

会议论文>

论文:4 占比:0.00%

专利文献>

论文:291922 占比:99.94%

总计:292094篇

图像标注—发文趋势图

图像标注

-研究学者

  • 周铭柯
  • 朱松豪
  • 柯逍
  • 李宁
  • 杨雪
  • 侯广大
  • 刘晨楠
  • 刘汝杰
  • 堵明明
  • 宋海玉
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 李艳; 金小峰
    • 摘要: 针对基于Transformer框架的图像标注任务中提取视觉特征容易引入噪声问题且为了进一步提高视觉的上下文信息,提出了一种基于综合几何关系稀疏自注意力机制的图像标注方法。首先通过结合图像区域的绝对位置、相对位置和空间包含关系提取详细全面的视觉表示,获取图像中潜在的上下文信息;其次提出了注意力层权重矩阵的稀疏化方法,该方法解决了Transformer忽略图像区域的局部性并引入噪声信息的问题;最后,采用了强化学习方法作为指导策略,实现模型在句子级别优化目标序列。通过在MS-COCO数据集上进行的对比实验结果表明,提出的方法在BLEU1、BLEU4、METEOR、ROUGE-L、CIDEr和SPICE指标上分别比基线模型提升了0.2、0.7、0.1、0.3、1.2和0.4,有效提升了图像自动标注的性能。
    • 罗菊香
    • 摘要: Corr-LDA-ITD模型较Corr-LDA模型具有更高的文本图像关联性,并且类标信息可以一定程度影响标注的准确性。基于此,文章首先利用Corr-LDA-ITD模型对不同类别的图像进行训练,然后用每类图像训练出的模型对测试图像进行测试,选出log似然值最大的标注模型对图像进行标注。在2个真实图像集(Labelme和Uiuc-sport)上的实验结果表明该方法的标注效果较好。
    • 沈贵华; 张炼; 姜博
    • 摘要: 中草药数据具有丰富的数字化资源,利用标注的方法对中草药的类别和功能进行分析是一种能够实现文化识别、文化解读、文化传承的科学技术方法。本文聚焦于中草药领域的书籍图像数据,实现了对图文混排的中草药书籍数据的数字图文处理与关联标注。本文提出了基于语义一致性约束的中草药关联标注算法,针对中草药图片存在的类间差距较小,图像多形态等问题综合使用了特征提取模型,注意力机制等结构,并针对中草药数据的特点对经典标注模型结构进行优化,实现中草药图像的标注任务。
    • 赵振喜; 王朔; 刘春生; 郭玉福; 王朝辉; 武桐; 范恩洪; 侯林江
    • 摘要: 针对变电站智能巡检,在变电站传统辅助系统及前期布设或配备的视频监控装置、机器人巡检、单兵作业装备等设备接入层基础上,通过边缘物联代理,以及人工智能(artificial intelligence, AI)分析服务器内置集成AI视觉分析算法和模型,构建分析服务层,以实现变电站智能巡检设备状态实时监测、站端表计智能识别、环境智能实时监测、人员安全智能评估、安全作业监控、电子虚拟围栏等业务场景;同时,介绍了卷积神经网络主要技术路线,着重介绍了以站内烟火作为实例对视觉学习算法构建成熟实用的视觉学习模型,验证了其技术先进性、可行性,减少了变电站巡检人员工作量,提高了站内事故隐患分析和处理效率,从而较大地提高了变电站安全管理水平。
    • 何儒汉; 舒启杰; 黄晋
    • 摘要: 针对图像标注任务中的标注精度不高等问题,提出融合强化学习与迁移对抗的图像标注方法 FLTAN,利用强化学习和迁移学习的优势,有效改善了服装数据集图片标注信息不足的问题,使标注内容更加丰富。该方法在动态对抗域适应模型DAAN的基础上加入注意力机制与循环神经网络以获取图像位置信息,再利用强化学习相关算法对图像显著位置依次判断所属类别并计算期望,将期望最大的类别作为最终图像分类,从而提升模型的分类准确性。在迁移学习部分,对生成的特征进行剪裁/标准化操作以固定数据范围,并加快梯度下降求解速度,提升标注精度。将该方法与多个模型进行实验对比,结果表明,该方法相比其他模型的准确率都有一定提升。
    • 巢海鲸
    • 摘要: 针对图像标注和注意力机制结合过程中特征不充分性和预测过程中特征权重不足性,提出了一种多层多模态语义空间的图像注意力标注方法.通过多层多模态公共语义空间对文本和图像改进网络,从基于文本的语言模型中利用多层的深度卷积神经网络特征提取上下文和句子;利用非线性特征图视觉映射到各层的文本和句子中获得多个公共语义空间实例,其中所有目标文本和视觉文本之间是以余弦相似度进行计算的;构建多层多模注意力机制在每个输出层都加入视觉特征,选择一层与图像上下文得分相关性最高的一层作为输出标注.实验结果表明,该方法能较好地提取注意力区域并给出标注,与其他传统方法对比,文中提出的模型标注结果具有一定优势.
    • 练连荣; 项欣光
    • 摘要: 随着社交网络的快速发展,带有用户提供标签的社交网络图像呈现爆炸式增长.但是用户提供的标签是不准确的,存在很多不相关以及错误的标签.这势必会增加相关多媒体任务的困难.针对标签噪声无序性以及常用的高斯分布对标签噪声中大噪声过于敏感的问题,但是高斯分布对大噪声比较敏感.鉴于此,采用对各种噪声都具有鲁棒性的柯西分布拟合噪声,提出了一个基于噪声柯西分布的弱监督非负低秩深度学习(CDNL)模型,通过柯西分布建模标签噪声来获得理想标签,并利用深度神经网络模块学习视觉特征和理想标签之间的内在联系,来得到图像对应的正确标签,从而大幅提高社交网络图像的标签准确率.所提模型不仅可以修正错误标签、补充缺失标签,也可以对新图像进行标注.在2个公开的社交网络图像数据集上进行了验证,并且与一些最新的相关工作进行了对比,证实了所提模型的有效性.
    • 王若宸; 朱学芳
    • 摘要: 图像资源在非物质文化遗产的保护工作中扮演着重要角色.针对现有非遗图像资源在呈现和组织中存在的问题,基于已有的成熟理论和方法体系,提出一种专门面向非遗图像语义信息的描述方法.基于Panofsky和Shatford的图像学理论模型构建专门面向非遗数字图像的语义描述框架,针对该框架设计一个完整的图像上下文关键词提取流程,并对该流程进行相应的实验操作和有效性实证研究.实验成功从样本数据中提取出语义关键词信息,表明本文的方法在总体上优于现有的著录体系,能带来更高的精准度和召回率.
    • 胡明玉; 夏雪; 杨晨雪; 曹景军; 柴秀娟
    • 摘要: 针对深度学习研究中标注训练样本费时费力的问题,以食用菌为研究对象,设计一种基于深度学习的半监督图像标注方法.该方法将深度学习目标检测模型与迭代图像标注工作有效结合,采用“检测模型训练—目标自动检测—人工标注修正—检测模型更新”的迭代操作,实现半监督方式的图像标注.基于所设计的方法构建了半监督图像标注系统,在试验中对系统进行性能评测和分析.结果 表明:迭代更新后的检测模型在测试集上的检测准确率为98.1%,召回率为88.5%,平均准确率为88.3%;利用所构建的半监督图像标注系统可以实现15 s/幅的标注速度,单幅图像的标注耗时仅为纯手工标注耗时的2.5%,图像标注时间代价大幅降低.研究结果为深度学习研究中的训练样本标注提供了高效的标注方法和工具,有助于提高图像标注效率,减少人力成本投入.
    • 俞宵; 张大富; 张鹏; 范俊甫
    • 摘要: 随着深度学习的发展,遥感影像处理技术也从传统机器学习算法向深度学习转变,然而,用于遥感图像的训练数据集却十分稀少,且数据标注困难.本文将GIS技术与图像标注技术相结合,基于Flask Web框架设计一个可用于海量遥感数据的标注系统.该系统可用于海量遥感数据的数据框标注、数据类别标注,以及目标关键点标注,同时能将标注数据导出为深度学习训练最常用的COCO数据集和VOC2007两种格式.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号