注意力机制
注意力机制的相关文献在2001年到2023年内共计6446篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文3326篇、会议论文35篇、专利文献88576篇;相关期刊672种,包括计算机工程、计算机工程与设计、计算机工程与应用等;
相关会议15种,包括第十四届计算机辅助设计与图形学学术会议、第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会、2018年全国高性能计算学术年会 等;注意力机制的相关文献由17463位作者贡献,包括王鹏、余正涛、张伟等。
注意力机制—发文量
专利文献>
论文:88576篇
占比:96.34%
总计:91937篇
注意力机制
-研究学者
- 王鹏
- 余正涛
- 张伟
- 王军
- 王勇
- 张鹏
- 王健
- 王鑫
- 刘杰
- 姜明
- 张强
- 徐晓刚
- 高盛祥
- 廖祥文
- 张宇
- 李平
- 焦李成
- 王中卿
- 郭军军
- 陈刚
- 刘博
- 刘洋
- 张新钰
- 张杰
- 张涛
- 张磊
- 李磊
- 李静
- 林鸿飞
- 潘勉
- 王斌
- 王涛
- 王磊
- 王超
- 相艳
- 罗光春
- 赵鑫
- 闫超
- 魏志强
- 黄于欣
- 刘小洋
- 刘敏
- 刘磊
- 吕帅帅
- 周国栋
- 张凯
- 张勇东
- 李波
- 李超
- 李鹏
-
-
张勇;
郭永存;
陈伟;
王爽;
程刚
-
-
摘要:
针对传统轻量型卷积神经网络模型复杂度高,移动端识别速度慢,小样本数据集上训练、识别效果差的等问题,提出一种高效的改进后的移动端煤矸识别方法;分析卷积神经网络模型轻量化的方法,并从注意力机制、激活函数和分类头3个方面对MobileNetv3网络进行改进,通过模型量化压缩网络在移动端部署模型,分析改进网络量化前、后的空间存储容量,浮点运算次数,推理时间和识别准确率;在移动端煤矸识别实验装置中训练、部署和测试模型的识别效果。结果表明:改进后网络经过20次的训练后模型即收敛,收敛速度较快,训练和验证准确率均大于99%;改进后模型经量化压缩后模型存储容量较小,仅为原网络的24.64%,模型复杂度大幅度下降;移动端推理时间仅为77 ms,识别准确率达到99.7%;利用实验装置实时采集的煤和矸石图像的识别效果较好,识别方法可靠。
-
-
辛泽寰;
尚振宏
-
-
摘要:
太阳暗条作为太阳大气磁场的示踪,对研究太阳磁场有极其重要的意义.针对现有的暗条检测方法存在检测精度不高,弱小暗条错检、漏检等问题,提出一种基于改进VNet网络的太阳暗条检测方法.首先,使用大熊湖天文台Hα全日面图像并结合磁图制作了太阳暗条数据集;其次,在VNet网络下采样部分采用Inception模块融合不同尺度特征图的特征,同时加入注意力机制增强特征图中暗条部分的语义信息;最后在上采样部分引入深度监督模块,更多地保留太阳暗条的细节特征.为验证算法性能,采用191幅Hα全日面图像数据集,其中包含暗条共3372条.算法在测试数据集上平均准确率达到0.9883,F1值达到0.8385.实验结果证明,该方法可以有效识别Hα全日面图中的暗条.
-
-
耿浩;
孙佳华;
李艺;
魏永长
-
-
摘要:
对新型冠状病毒肺炎疫情的准确预测能为疫情防控政策的制定提供重要依据,为此提出基于双向门控循环单元(BiGRU)和注意力机制(Attention Mechanism)的预测模型.考虑到新冠肺炎每日新增确诊人数的时序特性和非线性,采用了一种BiGRU网络,以减小计算代价并充分利用前、后向数据信息;同时引入注意力机制解决信息过载问题,以提高计算效率和预测精度.最后,通过英国和美国在2020年1月22日至2021年3月21日期间的每日新冠肺炎新增确诊病例数据集验证了所提方法的有效性.
-
-
李冉冉;
刘大明;
刘正;
常高祥
-
-
摘要:
目前多数文本分类方法无法有效反映句子中不同单词的重要程度,且在神经网络训练过程中获得的词向量忽略了汉字本身的结构信息。构建一种GRU-ATT-Capsule混合模型,并结合CW2Vec模型训练中文词向量。对文本数据进行预处理,使用传统的词向量方法训练的词向量作为模型的第1种输入,通过CW2Vec模型训练得到的包含汉字笔画特征的中文词向量作为第2种输入,完成文本表示。利用门控循环单元分别提取2种不同输入的上下文特征并结合注意力机制学习文本中单词的重要性,将2种不同输入提取出的上下文特征进行融合,通过胶囊网络学习文本局部与全局之间的关系特征实现文本分类。在搜狗新闻数据集上的实验结果表明,GRU-ATT-Capsule混合模型相比TextCNN、BiGRU-ATT模型在测试集分类准确率上分别提高2.35和4.70个百分点,融合笔画特征的双通道输入混合模型相比单通道输入混合模型在测试集分类准确率上提高0.45个百分点,证明了GRU-ATTCapsule混合模型能有效提取包括汉字结构在内的更多文本特征,提升文本分类效果。
-
-
周隽杰;
付东翔
-
-
摘要:
针对风洞流量测量中传统静态软测量模型估计精度低、鲁棒性差等问题,提出了注意力机制(Attention mechanism,Attention)、长短时记忆神经网络(Long short-term memory,LSTM)和卡尔曼滤波(Kalman filtering,Kalman)结合的Attention-LSTM-Kalman软测量模型:通过LSTM网络建立静态软测量模型,在此基础上,提出一种基于注意力机制的改进方案,考虑到系统的动态特性,使用卡尔曼滤波动态调整软测量模型输出序列。实验结果表明,静态预测模型LSTM的预测效果优于循环神经网络(Recurrent neural network,RNN)和门控循环单元(Gated recurrent unit,GRU)等模型;基于LSTM、Attention-LSTM和Attention-LSTM-Kalman的3种模型的对比预测测量结果表明,注意力机制能有效提高模型精准度,引入卡尔曼滤波改善了模型的动态测量特性。该模型方案在风洞系统的流量测量验证了其可行性和有效性。
-
-
刘路路;
杨燕;
王杰
-
-
摘要:
随着互联网的不断发展,面向电商产品的用户评论日益增加。研究这些用户评论的情感导向,对于指导产品的更新迭代具有重要意义。以往的方面级情感分析任务通常只涉及文本模态,然而用户的评论数据一般不仅包括纯文本,还包括大量的图文数据。针对这种包括文本和图片的多模态数据,提出了一种新的方面级多模态情感分析模型ABAFN(aspect-based attention and fusion network)。模型结合预训练语言模型BERT和双向长短时记忆网络来获得文本和方面词的上下文表示,同时利用预训练残差网络ResNet提取图片特征生成视觉表示;利用注意力机制基于方面词对上下文表示和视觉表示进行加权;将两个模态加权后的表示级联融合执行情感标签分类任务。在Multi-ZOL数据集上的实验表明,ABAFN模型的性能超过了目前已知文献的结果。
-
-
郑建兴;
郭彤彤;
申利华;
李德玉
-
-
摘要:
基于评论文本的深度学习推荐方法主要利用评论文本刻画用户和项目的特征信息,学习用户对项目的评分关系,提升推荐的性能。现有研究工作在提高推荐系统精度质量的同时,忽略了情感特征在评分预测中的可解释性贡献。针对此问题,考虑了评论文本以及情感倾向分别在用户和项目嵌入中的作用,提出了一种基于评论文本情感注意力的推荐方法(IncorRAS-Rec)。首先,通过卷积神经网络(CNN)处理用户和项目的评论集,对用户和项目的评论文本进行评论特征表示,并提取相关的用户特征信息和项目特征信息,进而结合用户对项目的评分偏好,学习用户和项目的评论情感特征表示;其次,基于注意力机制为用户和项目聚合了相关的评论情感特征信息,学习用户和项目的嵌入表示;最后,结合偏置信息,基于用户和项目的嵌入预测了用户对项目的评分。在亚马逊公开数据集上进行了实验比较和分析,对模型性能进行了有效性评估。实验结果表明:所提IncorRAS-Rec模型不仅在均方根误差(RMSE)和平均绝对误差(MAE)评价指标上的性能要优于其他传统方法,而且能够实现基于情感特征在评分预测方面的解释性作用。
-
-
李坤;
周世斌;
朱佳明;
张国鹏
-
-
摘要:
目前图像描述技术的主要架构是基于深度神经网络的Encoder-Decoder架构.大多数工作集中在图像的特征提取和注意力机制上,如hard注意力模型和top-down注意力模型等.这些方法仅使用上一时刻的信息预测当前时刻的输出,使得解码器的输入信息的时间维度单一,同时解码器的单个输出也影响着预测结果的准确性.本文提出横向和纵向的多时间维度信息融合的图像描述模型,其中模型的横向结构使用过去和现在时刻的语义信息丰富解码器的输入,模型的纵向结构同时生成现在和未来时刻的预测向量来丰富解码器的输出,模型两种独立结构的解码器都生成多个输出,然后分别对其进行加权融合作为模型两种结构的最终输出.在Flickr30k和MSCOCO两个数据集上的实验结果表明,模型的两种结构在多个评价指标上的得分超过了其他主流的模型,对图像的描述更准确.
-
-
张锦;
屈佩琪;
孙程;
罗蒙
-
-
摘要:
针对现有安全帽佩戴检测干扰性强、检测精度低等问题,提出一种基于改进YOLOv5的安全帽检测新算法。首先,针对安全帽尺寸不一的问题,使用K-Means++算法重新设计先验框尺寸并将其匹配到相应的特征层;其次,在特征提取网络中引入多光谱通道注意力模块,使网络能够自主学习每个通道的权重,增强特征间的信息传播,从而加强网络对前景和背景的辨别能力;最后,在训练迭代过程中随机输入不同尺寸的图像,以此增强算法的泛化能力。实验结果表明,在自制安全帽佩戴检测数据集上,所提算法的均值平均精度(mAP)达到96.0%,而对佩戴安全帽的工人的平均精度(AP)达到96.7%,对未佩戴安全帽的工人的AP达到95.2%,相较于YOLOv5算法,该算法对佩戴安全帽的平均检测准确率提升了3.4个百分点,满足施工场景下安全帽佩戴检测的准确率要求。
-
-
盘展鸿;
朱鉴;
迟小羽;
蔡瑞初;
陈炳丰
-
-
摘要:
现有的基于深度学习的单张图像超分辨率(single image super-resolution, SISR)模型通常是通过加深网络层数来提升模型的拟合能力,没有充分提取和复用特征,导致重建图像的质量较低。针对该问题,提出了基于特征融合和注意力机制的图像超分辨率模型。该模型在特征提取模块使用残差中嵌入残差(residual in residual, RIR)的结构,该网络的特征提取模块由包含多个残差块的残差组构成,并且在每个残差组内进行局部特征融合,在每个组之间进行全局特征融合。此外,在每一个残差块中引入坐标注意力模块,在每一个残差组中引入空间注意力模块。经验证,该模型能充分提取特征并且复用特征。实验最终结果表明,该模型在客观评价指标和主观视觉效果上都优于现有的模型。
-
-
-
LI Jingyu;
李京谕;
FENG Yang;
冯洋
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
近年来,神经机器翻译(Neural machine translation,NMT)表现出极大的优越性,然而如何在翻译一个文档时考虑篇章上下文信息仍然是一个值得探讨的问题.传统的注意力机制对源端的所有词语进行计算,而在翻译当前句子时篇章中大量的信息中只有小部分是与之相关的.在篇章级机器翻译中,采用传统的注意力机制建模篇章信息存在着信息冗余的问题.该文提出了一种联合注意力机制,结合“硬关注”和“软关注”的机制对篇章上下文的信息进行建模.关键思想是通过“硬关注”筛选出与翻译当前句子相关的源端历史词语,然后采用“软关注”的方法进一步抽取翻译中所需的上下文信息.实验表明,相比于基线系统,该方法能使翻译性能获得明显提升.
-
-
-
LIU Ke-nan;
刘克楠;
HOU Jian;
侯剑
- 《中国计算机用户协会网络应用分会2020年第二十四届网络新技术与应用年会》
| 2020年
-
摘要:
语音识别已经在服务、医疗、家电等行业中得到广泛的应用.智能设备中,语音交互系统的能耗较高,往往处于关闭状态.而唤醒词识别功能能耗相对较低,可以在后台保持开启状态,便于进行实时监测.当识别出唤醒词之后,设备才会开启智能交互系统.因此,唤醒词识别是语音识别技术的重要因素.论文融合残差网络、语音端到端网络、循环神经网络,引入注意力机制,并尝试多种损失函数,构造了一种有效的应用于唤醒词识别的网络结构.在企业内部数据集上,经过大量实验,并与多种不同网络结构对比,取得了良好的效果.其召回率达到90%以上,误唤醒率1%,效果明显优于传统的方法.
-
-
-
Zhu Jinghua;
朱敬华;
Guo Xu;
郭旭
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着互联网应用的蓬勃发展,网络数据信息以指数级别爆炸增长.推荐系统作为解决信息过载的有效手段,成为工业界与学术界的研究热点.面向用户隐式反馈的推荐算法主要基于协同过滤和贝叶斯个性化排序等方法,这些方法对点击、收藏、加入购物车等用户行为的隐式反馈特征利用不充分.本文提出一种基于神经网络的用户向量化表示模型,能够充分利用用户的多种隐式反馈特征.同时本文借鉴机器翻译中的Self-attention模型设计一种推荐模型,融合用户向量化表示和用户-项目交互的动态时序特征,从而提高推荐系统性能.在公开数据集上进行对比实验,结果表明,与其他面向隐式反馈推荐模型方法相比,本文提出的推荐模型具有更好的推荐性能,并且对于用户行为特征具有很好的泛化能力.
-
-
桂林;
陆勤;
徐睿峰;
杜嘉晨;
胡健楠;
高清红
- 《智能时代的创新、融合与发展——2018全国博士后学术交流会》
| 2018年
-
摘要:
文本情感分析是自然语言处理领域的一个重要研究问题,其基本任务旨在对文本情感的类别进行判断,对文本情感的要素,例如:情感的发起者、情感的对象、情感的原因等等进行抽取.伴随着深度学习方法的兴起,目前基于神经网络的方法已经成为文本情感分析领域的主流方法之一.但是目前的深度学习方法大多数将文本情感分析作为实验对象,并未对情感分析问题本身进行深入的解构.为此,本文以卷积神经网络为例,进行了一下几个方面的工作:首先,从数学的角度对卷积神经网络在文本情感分析中的工作原理进行了解析;其次,在这一解析的基础上,利用卷积进行基于注意力机制的加权,与多种不同的神经网络进行结合;最后,在多个情感分析相关问题的实验上验证了相关方法的有效性.
-
-
-
Zhao Yubo;
赵昱博
- 《第十五届中国智能交通年会》
| 2020年
-
摘要:
交通流量预测具有重要的现实意义,提高其预测的精准度是相关领域的研究重点.本文提出了一种基于Conv-LSTM的短时交通流量预测方法,以交通GPS数据为基础,通过数据预处理生成时空流量矩阵,利用卷积网络提取流量特征,并融合外部影响因子,对LSTM网络进行时间维度的流量预测.经实验验证,该模型性能表现较好,预测结果较为准确地反映出交通流量的变化趋势,与类似方法对比具有一定的优越性.
-
-
Zhao Yubo;
赵昱博
- 《第十五届中国智能交通年会》
| 2020年
-
摘要:
交通流量预测具有重要的现实意义,提高其预测的精准度是相关领域的研究重点.本文提出了一种基于Conv-LSTM的短时交通流量预测方法,以交通GPS数据为基础,通过数据预处理生成时空流量矩阵,利用卷积网络提取流量特征,并融合外部影响因子,对LSTM网络进行时间维度的流量预测.经实验验证,该模型性能表现较好,预测结果较为准确地反映出交通流量的变化趋势,与类似方法对比具有一定的优越性.