您现在的位置: 首页> 研究主题> 注意力机制

注意力机制

注意力机制的相关文献在2001年到2023年内共计6446篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术 等领域,其中期刊论文3326篇、会议论文35篇、专利文献88576篇;相关期刊672种,包括计算机工程、计算机工程与设计、计算机工程与应用等; 相关会议15种,包括第十四届计算机辅助设计与图形学学术会议、第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会、2018年全国高性能计算学术年会 等;注意力机制的相关文献由17463位作者贡献,包括王鹏、余正涛、张伟等。

注意力机制—发文量

期刊论文>

论文:3326 占比:3.62%

会议论文>

论文:35 占比:0.04%

专利文献>

论文:88576 占比:96.34%

总计:91937篇

注意力机制—发文趋势图

注意力机制

-研究学者

  • 王鹏
  • 余正涛
  • 张伟
  • 王军
  • 王勇
  • 张鹏
  • 王健
  • 王鑫
  • 刘杰
  • 姜明
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 张勇; 郭永存; 陈伟; 王爽; 程刚
    • 摘要: 针对传统轻量型卷积神经网络模型复杂度高,移动端识别速度慢,小样本数据集上训练、识别效果差的等问题,提出一种高效的改进后的移动端煤矸识别方法;分析卷积神经网络模型轻量化的方法,并从注意力机制、激活函数和分类头3个方面对MobileNetv3网络进行改进,通过模型量化压缩网络在移动端部署模型,分析改进网络量化前、后的空间存储容量,浮点运算次数,推理时间和识别准确率;在移动端煤矸识别实验装置中训练、部署和测试模型的识别效果。结果表明:改进后网络经过20次的训练后模型即收敛,收敛速度较快,训练和验证准确率均大于99%;改进后模型经量化压缩后模型存储容量较小,仅为原网络的24.64%,模型复杂度大幅度下降;移动端推理时间仅为77 ms,识别准确率达到99.7%;利用实验装置实时采集的煤和矸石图像的识别效果较好,识别方法可靠。
    • 辛泽寰; 尚振宏
    • 摘要: 太阳暗条作为太阳大气磁场的示踪,对研究太阳磁场有极其重要的意义.针对现有的暗条检测方法存在检测精度不高,弱小暗条错检、漏检等问题,提出一种基于改进VNet网络的太阳暗条检测方法.首先,使用大熊湖天文台Hα全日面图像并结合磁图制作了太阳暗条数据集;其次,在VNet网络下采样部分采用Inception模块融合不同尺度特征图的特征,同时加入注意力机制增强特征图中暗条部分的语义信息;最后在上采样部分引入深度监督模块,更多地保留太阳暗条的细节特征.为验证算法性能,采用191幅Hα全日面图像数据集,其中包含暗条共3372条.算法在测试数据集上平均准确率达到0.9883,F1值达到0.8385.实验结果证明,该方法可以有效识别Hα全日面图中的暗条.
    • 耿浩; 孙佳华; 李艺; 魏永长
    • 摘要: 对新型冠状病毒肺炎疫情的准确预测能为疫情防控政策的制定提供重要依据,为此提出基于双向门控循环单元(BiGRU)和注意力机制(Attention Mechanism)的预测模型.考虑到新冠肺炎每日新增确诊人数的时序特性和非线性,采用了一种BiGRU网络,以减小计算代价并充分利用前、后向数据信息;同时引入注意力机制解决信息过载问题,以提高计算效率和预测精度.最后,通过英国和美国在2020年1月22日至2021年3月21日期间的每日新冠肺炎新增确诊病例数据集验证了所提方法的有效性.
    • 李冉冉; 刘大明; 刘正; 常高祥
    • 摘要: 目前多数文本分类方法无法有效反映句子中不同单词的重要程度,且在神经网络训练过程中获得的词向量忽略了汉字本身的结构信息。构建一种GRU-ATT-Capsule混合模型,并结合CW2Vec模型训练中文词向量。对文本数据进行预处理,使用传统的词向量方法训练的词向量作为模型的第1种输入,通过CW2Vec模型训练得到的包含汉字笔画特征的中文词向量作为第2种输入,完成文本表示。利用门控循环单元分别提取2种不同输入的上下文特征并结合注意力机制学习文本中单词的重要性,将2种不同输入提取出的上下文特征进行融合,通过胶囊网络学习文本局部与全局之间的关系特征实现文本分类。在搜狗新闻数据集上的实验结果表明,GRU-ATT-Capsule混合模型相比TextCNN、BiGRU-ATT模型在测试集分类准确率上分别提高2.35和4.70个百分点,融合笔画特征的双通道输入混合模型相比单通道输入混合模型在测试集分类准确率上提高0.45个百分点,证明了GRU-ATTCapsule混合模型能有效提取包括汉字结构在内的更多文本特征,提升文本分类效果。
    • 周隽杰; 付东翔
    • 摘要: 针对风洞流量测量中传统静态软测量模型估计精度低、鲁棒性差等问题,提出了注意力机制(Attention mechanism,Attention)、长短时记忆神经网络(Long short-term memory,LSTM)和卡尔曼滤波(Kalman filtering,Kalman)结合的Attention-LSTM-Kalman软测量模型:通过LSTM网络建立静态软测量模型,在此基础上,提出一种基于注意力机制的改进方案,考虑到系统的动态特性,使用卡尔曼滤波动态调整软测量模型输出序列。实验结果表明,静态预测模型LSTM的预测效果优于循环神经网络(Recurrent neural network,RNN)和门控循环单元(Gated recurrent unit,GRU)等模型;基于LSTM、Attention-LSTM和Attention-LSTM-Kalman的3种模型的对比预测测量结果表明,注意力机制能有效提高模型精准度,引入卡尔曼滤波改善了模型的动态测量特性。该模型方案在风洞系统的流量测量验证了其可行性和有效性。
    • 刘路路; 杨燕; 王杰
    • 摘要: 随着互联网的不断发展,面向电商产品的用户评论日益增加。研究这些用户评论的情感导向,对于指导产品的更新迭代具有重要意义。以往的方面级情感分析任务通常只涉及文本模态,然而用户的评论数据一般不仅包括纯文本,还包括大量的图文数据。针对这种包括文本和图片的多模态数据,提出了一种新的方面级多模态情感分析模型ABAFN(aspect-based attention and fusion network)。模型结合预训练语言模型BERT和双向长短时记忆网络来获得文本和方面词的上下文表示,同时利用预训练残差网络ResNet提取图片特征生成视觉表示;利用注意力机制基于方面词对上下文表示和视觉表示进行加权;将两个模态加权后的表示级联融合执行情感标签分类任务。在Multi-ZOL数据集上的实验表明,ABAFN模型的性能超过了目前已知文献的结果。
    • 郑建兴; 郭彤彤; 申利华; 李德玉
    • 摘要: 基于评论文本的深度学习推荐方法主要利用评论文本刻画用户和项目的特征信息,学习用户对项目的评分关系,提升推荐的性能。现有研究工作在提高推荐系统精度质量的同时,忽略了情感特征在评分预测中的可解释性贡献。针对此问题,考虑了评论文本以及情感倾向分别在用户和项目嵌入中的作用,提出了一种基于评论文本情感注意力的推荐方法(IncorRAS-Rec)。首先,通过卷积神经网络(CNN)处理用户和项目的评论集,对用户和项目的评论文本进行评论特征表示,并提取相关的用户特征信息和项目特征信息,进而结合用户对项目的评分偏好,学习用户和项目的评论情感特征表示;其次,基于注意力机制为用户和项目聚合了相关的评论情感特征信息,学习用户和项目的嵌入表示;最后,结合偏置信息,基于用户和项目的嵌入预测了用户对项目的评分。在亚马逊公开数据集上进行了实验比较和分析,对模型性能进行了有效性评估。实验结果表明:所提IncorRAS-Rec模型不仅在均方根误差(RMSE)和平均绝对误差(MAE)评价指标上的性能要优于其他传统方法,而且能够实现基于情感特征在评分预测方面的解释性作用。
    • 李坤; 周世斌; 朱佳明; 张国鹏
    • 摘要: 目前图像描述技术的主要架构是基于深度神经网络的Encoder-Decoder架构.大多数工作集中在图像的特征提取和注意力机制上,如hard注意力模型和top-down注意力模型等.这些方法仅使用上一时刻的信息预测当前时刻的输出,使得解码器的输入信息的时间维度单一,同时解码器的单个输出也影响着预测结果的准确性.本文提出横向和纵向的多时间维度信息融合的图像描述模型,其中模型的横向结构使用过去和现在时刻的语义信息丰富解码器的输入,模型的纵向结构同时生成现在和未来时刻的预测向量来丰富解码器的输出,模型两种独立结构的解码器都生成多个输出,然后分别对其进行加权融合作为模型两种结构的最终输出.在Flickr30k和MSCOCO两个数据集上的实验结果表明,模型的两种结构在多个评价指标上的得分超过了其他主流的模型,对图像的描述更准确.
    • 张锦; 屈佩琪; 孙程; 罗蒙
    • 摘要: 针对现有安全帽佩戴检测干扰性强、检测精度低等问题,提出一种基于改进YOLOv5的安全帽检测新算法。首先,针对安全帽尺寸不一的问题,使用K-Means++算法重新设计先验框尺寸并将其匹配到相应的特征层;其次,在特征提取网络中引入多光谱通道注意力模块,使网络能够自主学习每个通道的权重,增强特征间的信息传播,从而加强网络对前景和背景的辨别能力;最后,在训练迭代过程中随机输入不同尺寸的图像,以此增强算法的泛化能力。实验结果表明,在自制安全帽佩戴检测数据集上,所提算法的均值平均精度(mAP)达到96.0%,而对佩戴安全帽的工人的平均精度(AP)达到96.7%,对未佩戴安全帽的工人的AP达到95.2%,相较于YOLOv5算法,该算法对佩戴安全帽的平均检测准确率提升了3.4个百分点,满足施工场景下安全帽佩戴检测的准确率要求。
    • 盘展鸿; 朱鉴; 迟小羽; 蔡瑞初; 陈炳丰
    • 摘要: 现有的基于深度学习的单张图像超分辨率(single image super-resolution, SISR)模型通常是通过加深网络层数来提升模型的拟合能力,没有充分提取和复用特征,导致重建图像的质量较低。针对该问题,提出了基于特征融合和注意力机制的图像超分辨率模型。该模型在特征提取模块使用残差中嵌入残差(residual in residual, RIR)的结构,该网络的特征提取模块由包含多个残差块的残差组构成,并且在每个残差组内进行局部特征融合,在每个组之间进行全局特征融合。此外,在每一个残差块中引入坐标注意力模块,在每一个残差组中引入空间注意力模块。经验证,该模型能充分提取特征并且复用特征。实验最终结果表明,该模型在客观评价指标和主观视觉效果上都优于现有的模型。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号