首页> 外文期刊>電子情報通信学会技術研究報告 >口動作を編集した発話映像による音声聞き取りへの影響
【24h】

口動作を編集した発話映像による音声聞き取りへの影響

机译:嘴部动作编辑后的发声视频对音频收听的影响

获取原文
获取原文并翻译 | 示例
       

摘要

一般に視覚と聴覚は相互に影響し合っていることが知られている.音声の聞き取りにおいて,視覚情rn報の補完的役割が考えられる.そこで本研究では,音声の聞き取り時における視覚情報の役割について実験してきた.はじめに,顔映像が音声の聞き取りに与える影響を検証する実験を行った.その結果,音声の聞き取りにくい環境でのみ,顔映像は聞き取りに貢献し,視線は発話者の口元に集中することが示された.次に,聞き取り時における発話者の口の動きの影響と特性について実験を行った.実験では,顔映像内の一部分の動きだけを編集するシステムを構築した.しかし,これまでのシステムでは,発話者の顔に編集用のマーカーを付けなければならなかった.そのため,実験において被験者の視線がそのマーカーに集まってしまう傾向が見られた.そこで,今回,マーカーを使用せずに映像内の一部分の動きを編集できるシステムの構築を行った.そして,そのシステムを用いて口の動きの影響と特性について実験を行った.%Hearing and vision are affecting each other, visual information may contribute to auditory information when we recognize a speech.This study examined the contribution of visual information of speaker's face to speech cognition.In the first experiment, we analyzed the changes of eye movements of the experimental participants during speech cognition.Results of this experiment showed that accuracy of repeat has improved by visual information and that participants tended to look at speaker's mouth when noise was added to voice.Next, we experimented the contribution of the movement of the mouth to speech cognition.For this experiment, we constructed a system to change movement amount of certain parts of the face picture and made materials by this system.However, this system had to attach markers for edit to speaker's face. In this experiment, participants tended to look at a marker.Then, we improved this system for which markers are not required, and experimented again using this system.
机译:众所周知,视觉和听觉会相互影响。可以在音频收听中考虑视觉信息的补充作用。因此,在这项研究中,我们一直在尝试视觉信息在听语音中的作用。首先,我们进行了一项实验,以验证面部图像对语音听觉的影响。结果,表明面部图像有助于听觉,并且凝视仅在难以听见声音的环境下集中在讲话者的嘴上。接下来,我们进行了一个实验,研究了说话者在听音过程中嘴巴运动的影响和特征。在实验中,我们构建了一个仅编辑面部图像中部分运动的系统。但是,在以前的系统中,必须将用于编辑的标记附加到扬声器的面部。因此,在实验中,对象的视线倾向于聚集在标记处。因此,这次,我们构建了一个无需使用标记即可编辑视频一部分运动的系统。然后,我们使用该系统对口腔运动的影响和特征进行了实验。听力和视觉相互影响,当我们识别语音时视觉信息可能对听觉信息有所贡献。本研究探讨了说话人面部的视觉信息对语音认知的贡献。在第一个实验中,我们分析了人眼运动的变化实验参与者在语音认知过程中的实验结果表明,视觉信息提高了重复的准确性,并且当噪声被添加到语音中时参与者倾向于看说话者的嘴巴。语音认知:在本实验中,我们构建了一个系统来改变面部图像某些部分的运动量并通过该系统制作素材,但是该系统必须在演讲者的面部附加用于编辑的标记,在该实验中,参与者倾向于查看标记。然后,我们改进了不需要标记的系统,并再次使用该系统进行了实验。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号