首页> 外文期刊>電子情報通信学会技術研究報告 >顔領域の違いが読話性能に与える影響について
【24h】

顔領域の違いが読話性能に与える影響について

机译:关于脸部差异对阅读性能的影响

获取原文
获取原文并翻译 | 示例
       

摘要

Lipreading is the technique to recognize speaker's utterances from the motion with changing shape of the mouth. Although most of previous approaches to lipreading focus on the limited region of the mouth, utterances of some phonemes often accompany with the motion of surrounding areas together with the mouth movement. In this paper, we have compared four regions: (A) entire face region, (B) the region that the eyes and the nose are removed from the entire face region, (C) mouth and adjacent region, and (D) mouth region. Experimental results of word recognition and vowel/consonant recognition show that most of vowel recognition using the region (B) results in the highest performance, while different regions output the best performance on consonant recognition.%読話とは口の動きや形状を読み取り発話内容を理解する技術のことを指す.従来の読話の研究の多くは口唇領域に対して行われてきた.しかし,発話する音によっては口の動作が大きく周辺の奴や顎の形状の変化が大きい音や,口の動作が小さい音など,様々である.そこで本論文では(A)顔全体領域,(B)顔全体領域から目と鼻を除いた領域,(C)口唇領域と顎から鼻孔までの高さを含んだ領域,(D)口唇領域の4つの領域を用いて単語認識,母音・子音認識を行った.実験の結果,ほとんどの母音について領域(B)が最も高い性能を示し,一方で子音については音素ごとに認識性能が高い領域が異なることが分かった.
机译:唇读是一种通过说话人的嘴形变化来识别说话者说话的技术,尽管以前的大多数方法都是在嘴巴的有限区域上进行唇读,但某些音素的发音通常伴随着周围区域和嘴巴的运动在本文中,我们比较了四个区域:(A)整个脸部区域,(B)从整个脸部区域移开眼睛和鼻子的区域,(C)嘴巴和邻近区域,以及(D)单词识别和元音/辅音识别的实验结果表明,使用(B)区域的大部分元音识别性能最高,而不同区域的辅音识别性能最佳。指用于读取形状和理解语音内容的技术。大多数常规阅读语音研究已在嘴唇区域进行。然而,取决于发出的声音,存在各种声音,诸如大的嘴巴运动,周围的人或下巴的形状变化大以及小的嘴巴运动。因此,在本文中,(A)整个脸部区域,(B)除去眼睛和鼻子的整个脸部区域,(C)嘴唇区域和包括从下颌到鼻孔的高度的区域,以及(D)嘴唇区域我们使用四个区域进行了单词识别和元音/辅音识别。作为实验的结果,发现对于大多数元音而言,区域(B)表现出最高的性能,而辅音具有不同的区域,对于每个音素具有较高的识别性能。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2012年第431期|p.25-30|共6页
  • 作者单位

    豊橋技術科学大学 大学院工学研究科 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1;

    豊橋技術科学大学 大学院工学研究科 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1;

    豊橋技術科学大学 大学院工学研究科 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1;

    豊橋技術科学大学 大学院工学研究科 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    読話; 顔領域; active appearance models; 口形素;

    机译:読话;颜领域;active appearance models;口形素;
  • 入库时间 2022-08-18 00:28:47

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号