...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >横顔の発話シーンを用いた口形コード法に基づく単語読唇
【24h】

横顔の発話シーンを用いた口形コード法に基づく単語読唇

机译:基于横盘语音场景的口号方法的文字读数

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

本研究では、読唇手法のひとつである口形コード法を発話者の横顔の発話シーンから得られた形状特徴量時系列に適用し、従来の母音キーフレームに追加して子音キーフレームの自動検出法を提案する.上下唇の距離と下唇突起長の差分値である横顔形状特徴量の時間的変化より子音キーフレームを検出することで、従来の母音のみによる口形コード時系列推移表現を拡張する.キーフレームの口形認識は、上唇高さ,下唇高さ,上唇突起長,下唇突起長,口唇角度の5特徴量を用いて行う.これより得られる単語コード列と候補単語のコード列に対して、DP マッチングを行い、最近傍となる候補単語を発話単語として推定する.常用27単語と類似単語10ペアの認識対象単語群を用いて2つの認識実験を行った結果、それぞれ90.4%,86.7%の高い認識率を得た.
机译:在该研究中,作为嘴唇方法之一的矫正代码方法应用于从语音语音界面获得的形状特征量时间序列,并且将辅音密钥帧的自动检测方法添加到传统中元音关键框架。提出。通过从横向形状特征量的时间变化检测音频键帧,这是上嘴唇和下唇之间的距离与横向形状特征量之间的距离的差值,它扩展了备用码时间序列转换传统元音的表示。使用上唇高度,下唇高度,上唇突出长度,下唇突出长度,唇角5特征量来进行关键帧的嘴识别。 DP匹配在字代码序列的代码串上执行,并且从此获得的候选词,最近最近的候选词被估计为话语字。由于使用27个单词和类似单词10对的识别目标字组使用两个识别实验进行两次识别实验,分别获得90.4%和86.7%的高识别率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号