多模态融合
多模态融合的相关文献在2003年到2023年内共计501篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、教育
等领域,其中期刊论文149篇、会议论文3篇、专利文献63157篇;相关期刊100种,包括哈尔滨理工大学学报、中国图象图形学报、电脑知识与技术等;
相关会议3种,包括2014湖北省计算机学会学术年会、东钱湖论坛第三次会议-嵌入式系统及应用研讨会、第十四届全国人机语音通讯学术会议等;多模态融合的相关文献由1555位作者贡献,包括田捷、刘华平、杨鑫等。
多模态融合—发文量
专利文献>
论文:63157篇
占比:99.76%
总计:63309篇
多模态融合
-研究学者
- 田捷
- 刘华平
- 杨鑫
- 周武杰
- 孙富春
- 董峰
- 雷景生
- 阳洁
- 尤优博
- 张勇东
- 董迪
- 谭超
- 冯铃
- 刘文宇
- 刘爽
- 周军
- 孙斌
- 张慧君
- 张欣悦
- 张海刚
- 张祖平
- 曹檑
- 曾毅
- 杨春林
- 杨金锋
- 江武明
- 王勇
- 王坤
- 赵亮
- 郭秀花
- 靳婷
- 何成
- 冯志全
- 刘宏
- 刘振宇
- 卫文娟
- 唐胜
- 孙飞
- 张重
- 徐涛
- 李梅
- 李欢欢
- 林颢
- 欧阳琴
- 王伟明
- 王岩
- 王海江
- 秦承虎
- 赵杰文
- 邵曦
-
-
刘玉强;
顾晶晶;
孙明;
凌超
-
-
摘要:
提出了一种基于多模态融合的人群流量预测算法(multimodal fusion for crowd flow prediction,MFCFP).首先使用图卷积算子来探索区域之间的相关性以建立多模态,不同的模态可以捕捉不同的影响因素.然后进行多模态融合,并将带有注意力机制的基于图卷积神经网络应用于本文模型,以更好地建立相关区域关联.在真实数据集的实验证明了所提模型可以准确地预测人群活动流量.
-
-
马含;
李进明;
王竹君;
关威
-
-
摘要:
对于谣言给社会造成的恐慌,现有谣言检测方法不能有效提高检测精确性.因此,提出一种基于双向树多模态融合谣言检测方法,首先使用预先训练数据向量化,构建端到端的神经网络,以双向树实现特征提取;然后将它输入到全连接层并进行多模态特征拼接,最后采用交叉熵损失函数进行训练.对比传统模型,实验结果表明,该方法能有效提取特征并提高谣言检测的精确性.
-
-
薛其威;
伍锡如
-
-
摘要:
针对无人驾驶系统环境感知中的车辆检测精度低的问题,本文提出一种基于多模态特征融合的三维车辆检测算法。该算法通过毫米波雷达与摄像机联合标定,匹配2个传感器间的坐标关系并减小采样误差;采用统计滤波剔除毫米波雷达数据冗余点,减少离群点干扰;构造多模态特征融合模块,利用逐像素平均融合点云与图像信息;加入特征金字塔提取融合后的高级特征信息提升复杂道路场景下的检测精度;建立特征融合区域建议结构,根据高级特征信息生成区域建议;使用非极大值抑制去除冗余检测框后,通过检测框顶点匹配输出车辆检测结果。经KITTI数据集实验结果表明:所提出的方法能够快速、准确地实现车辆检测,平均检测时间为0.14 s,平均检测精度为84.71%。该算法具有重要的理论和应用价值,可为无人驾驶系统的车辆检测提供有效方案。
-
-
颜增显;
孔超;
欧卫华
-
-
摘要:
人脸反欺骗技术可以准确判断捕获的人脸图像是真实人脸还是虚假人脸,是人脸识别系统安全的重要保障。传统的人脸反欺骗方法主要是利用手工设计的特征,如LBP、HoG、SIFT、SURF和DoG来刻画真实人脸和虚假人脸之间的不同特征分布,但人工设计的特征难以适应无约束环境下(如光照、背景的变化)的人脸反欺骗问题。鉴于此,该文提出一种多模态融合卷积神经网络模型,通过融合不同模态上的人脸特征来实现鲁棒的人脸反欺骗。首先根据通道注意力网络设计了多模态共享分支网络来实现特征提取过程中不同模态间的信息交互,然后在通道注意力融合网络的基础上提出了多模态通道注意力融合网络来融合不同模态的特征,最后利用融合后的多模态特征进行分类。在CASIA-SURF数据集上的大量实验结果表明,与主流的多模态人脸反欺骗方法(multi-scale fusion)相比,该方法在APCER和ACER指标上分别降低了1.1%和0.4%,充分证明该方法可以有效融合不同模态的特征,提高模型的鲁棒性。
-
-
庾骏;
黄伟;
张晓波;
尹贺峰
-
-
摘要:
哈希作为一种有效的数据表征技术,已经在应对爆炸式增长的多媒体数据中扮演了重要的角色.它由于低存储和高效率的优势,在多媒体检索领域受到了越来越多的关注.目前多模态哈希学习方法在多媒体检索任务中得到了较好的研究和发展.然而,多数的方法通过编码特征的内积重构成对相似度来保持原始数据的结构信息,但是带来较复杂的优化问题.此外一些模型缺乏判别性使得检索性能的提升受到限制.为了克服上述问题,本文提出一种新型的多模态融合哈希方法,在类别信息的监督下利用Hadamard矩阵为数据生成目标编码,通过松弛严格的二值约束增大类间的间隔,同时采用图嵌入的方式促进类内的紧凑性.本文提出的方法既保证了模型具有很好的判别能力也简化了优化过程.在3个公开数据集上的实验结果表明,本文提出的方法在多媒体数据检索中是非常有效的,平均性能上相比最优的对比方法提高了8.47%.
-
-
孟杰;
王莉;
杨延杰;
廉飚
-
-
摘要:
针对虚假信息检测中图片特征提取不充分,以及忽视了单模内关系以及单模与多模之间交互作用的问题,提出一种基于文本和图片信息的多模态深度融合(MMDF)模型。首先,用双向门控循环单元(Bi-GRU)提取文本的丰富语义特征,用多分支卷积−循环神经网络(CNN-RNN)提取图片的多层次特征;然后,建立模间和模内的注意力机制以捕获语言和视觉领域之间的高层交互,并得到多模态的联合表征;最后,将各模态原表征与融合后的多模态联合表征依据注意力权重进行再融合,以加强原信息的作用。该模型与多模态变分自动编码器(MVAE)模型相比,在中国计算机学会(CCF)竞赛和微博数据集上的准确率分别提升了1.9个百分点和2.4个百分点。实验结果表明,所提模型能够充分融合多模态信息,有效提高虚假信息检测的准确率。
-
-
安明慧;
王晶晶;
刘启元;
李林钦;
张大鑫;
李寿山
-
-
摘要:
作为一个交叉领域的研究任务,多模态抑郁症检测在自然语言处理、计算机视觉、心理健康分析等研究领域吸引了越来越多研究人员的关注。目前存在的研究工作主要致力于利用用户产生的社交网络数据进行抑郁症检测。然而,由于社交网络数据量通常较大,已有的研究方法存在捕捉长距离依存信息(即全局信息)不足的缺陷。因此,如何获取用户的全局信息来帮助检测抑郁症成为一个亟需解决的问题。另外,考虑到社交媒体数据不仅包含文本信息,还包含图片等信息,如何同时融合多个模态的全局信息来帮助检测抑郁症成为另一个亟需解决的问题。为了解决上述困境,该文提出了一种基于层次化动态路由机制的多模态抑郁症检测方法。通过层次化的结构来获取用户的全局信息,并且通过基于动态路由机制的融合方法,来动态地根据任务调整多模态融合特征来帮助检测抑郁症。实验结果表明,该文方法能有效地捕捉用户全局信息,并能进一步融合多模态信息,从而显著提高抑郁症检测任务的性能。
-
-
王莉
-
-
摘要:
网络社交媒体已经成为人们获取和共享信息的重要平台,同时也为虚假信息产生与快速传播提供了渠道。网络虚假信息检测技术的研究迫在眉睫。通过梳理近10年该领域的国内外相关研究,根据所基于的数据对象不同,从基于信息内容、用户画像、传播结构的虚假信息检测3个方面进行了阐述与分析。其中,基于信息内容的方法又分为基于文本、基于图像和基于文本图像多模态融合的方法。进而,介绍了国内外主要的虚假信息检测平台与系统。最后对网络虚假信息检测中面临的主要挑战及未来研究方向进行了讨论。
-
-
高鹏;
李海芳
-
-
摘要:
从脑电/脑磁、功能磁共振以及同步脑电-功能磁共振三种具有代表性的非侵入性神经影像典型技术出发,回顾了不同模态的发生发展,梳理了每个模态相关研究的主要研究进展,强调了多模态融合分析技术的重要性,结合多模态神经影像分析平台、脑影像大数据平台建设和辅助临床诊断治疗等方面的实践应用,探讨多模态神经功能成像新技术面临的技术挑战及其在促进脑科学发展中的意义,同时对神经影像技术发展做出总结和展望。
-
-
秦放;
曾维佳;
罗佳伟;
徐鹏
-
-
摘要:
基于深度学习的方法,利用多模态信息融合技术,将汽车等目标的声音、图像信息融合,用于对测试目标的判断。利用改进Inception网络对图像识别技术展开研究,分别比较了单纯图像信息情况的辨识、单纯声音信息情况的辨识,以及多模态融合情况下的辨识。通过试验分析和比较,证明该方法可以有效提高用户的图像识别能力,将特种车辆的平均识别精确度提升到97%以上,可用于特种车辆紧急避让等情况,具有很好的应用价值。
-
-
-
Shuai Wang;
王帅;
ShiZhe Chen;
陈师哲;
Qin Jin;
金琴
- 《第十四届全国人机语音通讯学术会议》
| 2017年
-
摘要:
视频兴趣度预测有着广泛的应用前景,比如提高视频检索和视频推荐的性能.由于每个人的喜好不同,想要找到通用的兴趣度准则是十分困难的.在本文中,构建了基于多模态特征融合和成对排序模型学习的预测系统.系统能利用视频中的听觉和视觉信息,并且模型的训练模拟人的评判过程,从而能够利用数据之间丰富的信息使兴趣度预测更加可靠.通过在MediaEval2016兴趣度预测比赛数据集上的实验比较,提出的预测系统可以更好的利用数据和标签并超越分类或回归的基线系统.
-
-
- 《东钱湖论坛第三次会议-嵌入式系统及应用研讨会》
| 2003年
-
摘要:
本文讨论了嵌入式多媒体系统的几个应用.在对多媒体技术研究的基础上,提出了嵌入式视频-音频多模态融合处理芯片,嵌入式视频摘要生成芯片等新的想法.鉴于技术的日趋成熟,更多的嵌入式多媒体处理系统将会问世.