首页> 外文期刊>電子情報通信学会技術研究報告. イメージ·メディア·クォリティ >時空間的特徴を考慮したDNNによる手話翻訳手法の比較検討
【24h】

時空間的特徴を考慮したDNNによる手話翻訳手法の比較検討

机译:DNN考虑时空特征的DNN标志语言翻译方法比较

获取原文
获取原文并翻译 | 示例
           

摘要

動画からの手話翻訳において、AlexNetと呼ばれる2DCNN(2次元畳み込みニューラルネットワーク)とSeq2Seqと呼ばれる機械翻訳モデルを組み合わせた手話翻訳モデルが提案されている。これは、2DCNNによって空間的な情報を失った特徴量からGRU(Gated Recurrent Unit)によって時系列的な特徴量を抽出している手法と考えられる。しかし、手話の動作は手及び指の位置や形とその動きによって形成されるため、空間的な情報を保ったまま時系列的な情報を考慮できる手法がより適していると考えられる。そこで、本稿では、動画の各フレームから特徴量を抽出する段階で、時系列的な情報を考慮する様々な手法を提案し、比較検討を行った。時空間的特徴量抽出器の比較実験の結果、本実験で使用したデータセットでは、最適化されるパラメータの数と手話翻訳性能が反比例することが示唆された。そのため、パラメータ数が最も少ないOptical Flowのみを入力としたモデルが高い手話翻訳性能を示したと考えられる。
机译:从运动图像中的手语翻译已经提出了一个标志语言翻译模型,它结合了名为AlexNet的2DCNN(二维卷积神经网络)和称为SEQ2Seq的机器翻译模型。这被认为是通过从其中2dcnn丢失的空间信息丢失的特征量来提取时间序列特征量的方法。然而,由于手指的位置和形状的位置,形状形成了手语的操作,因此认为可以考虑具有空间信息的时间序列信息的方法更合适。因此,在本文中,我们提出了从运动图像的每个帧中提取特征量的各种方法,并提出了各种方法来考虑时间序列信息并进行比较。由于时空特征提取器的比较实验,建议在该实验中使用的数据集是要优化的参数数量的逆比例,并且标志语言翻译性能。因此,认为仅输入具有最小参数号的光流量的模型很高,指示高标志语言翻译性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号