首页> 外文会议>電子情報通信学会;電子情報通信学会総合大会演説論文集 >Deep Learning による視覚・言語融合の最前線
【24h】

Deep Learning による視覚・言語融合の最前線

机译:深度学习在视觉和语言融合方面走在前列

获取原文

摘要

Deep Learning の恩恵は,音声認識や画像認識,機械翻訳といった種々のタスクの精緻化だけではない.それぞれのタスクにおける手法が畳込みニューラルネットワーク(CNN: Convolutional Neural Network) や再帰型ニューラルネットワーク(RNN: Recurrent NeuralNetwork) によって表されるようになり,異分野の研究者にとっても理解しやすくなった.たとえば,CNN による高精度な画像認識ネットワークは,その中間層をデータの特徴量として再利用でき,従来の特徴量抽出手法よりも優れた特徴量抽出器としてほかの画像理解の研究に使われるようになった.さらに言語などの系列データはRNN で特徴量抽出や自然言語生成が可能となり,最近では商用の翻訳エンジンにも採用されている.各分野の共通ツールとしてDeep Learning が一般化した結果として,かつては独立に扱われていたようなモダリティのデータを融合し,理解・生成するような研究が大きな広がりを見せつつある.
机译:深度学习的好处不仅限于完善各种任务,例如语音识别,图像识别和机器翻译。卷积神经网络(CNN)和递归神经网络(RNN)现在代表了每种任务的方法,使不同领域的研究人员更容易理解。例如,使用CNN的高精度图像识别网络可以将中间层重新用作数据的特征量,并在其他图像理解研究中用作优于常规特征量提取方法的特征量提取器。成为。此外,RNN可用于特征数据提取和系列数据(例如语言)的自然语言生成,并且最近已在商业翻译引擎中采用。由于深度学习已成为各个领域的通用工具,因此融合,理解和生成曾经被独立对待的模态数据的研究正变得越来越普遍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号