首页> 外文期刊>電子情報通信学会技術研究報告. 画像工学. Image Engineering >ショット内及びショット間の画像·吉声特徴に着目したスピーチショット抽出
【24h】

ショット内及びショット間の画像·吉声特徴に着目したスピーチショット抽出

机译:语音镜头提取专注于镜头内部和镜头之间的图像和良好声音的特征

获取原文
获取原文并翻译 | 示例
           

摘要

本報告では,ショット内及びショット間の特徴に基づく被写体と話者の異同判定によるニュース映像からのスピーチショット抽出手法を提案する.スピーチショットはマルチメディア情報を豊富に含み,資料的価値が高い.そこで我々はこれまで,被写体の口唇動作と話者の声から得られる複数の音声特徴と画像特徴の相関に基づく被写体と話者の異同判定手法を提案してきた.この手法は,音声ノイズの少ないショットに対しては高精度な異同判定が可能であるが,多量の音声ノイズを含むショットに対しての異同判定は困難であった.そこで本報告では,2段階の処理による被写体と話者の異同判定手法を提案する.まず第1段階で,これまでに提案した手法により異同判定を行う.その後,第2段階で,ショット内及びその前後のショットとの間に表れる特徴的な画像·音声の性質に基づいて異同判定を行う.スピーチショット抽出実験の結果,提案手法の有効性を確認した.
机译:在此报告中,我们提出了一种通过根据镜头内和镜头之间的特征确定主题与说话者之间的差异来从新闻视频中提取语音镜头的方法。语音镜头包含大量的多媒体信息,具有很高的物质价值。因此,我们提出了一种基于多个语音特征和从对象的嘴唇运动和说话者的语音获得的图像特征之间的相关性来确定对象和说话者之间的差异的方法。该方法能够对声音声音少的镜头进行高精度的差判定,但是对于声音声音多的镜头难以进行差判定。因此,在本报告中,我们提出了一种通过两步处理确定对象和说话者之间差异的方法。首先,在第一阶段,通过到目前为止提出的方法来判断差异。然后,在第二阶段中,基于镜头中出现的特征图像/声音特性以及镜头前后的镜头之间的差异来判断差异。语音镜头提取实验的结果证实了该方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号