首页> 外文会议>情報処理学会全国大会 >ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識
【24h】

ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識

机译:使用软掩膜和声学模型自适应的同时三讲话者语音识别

获取原文

摘要

分離歪に適応させた音響モデルにソフトマスクを適応すると認識精度を改善することを確認した.音響モデルを分離歪に適応し,マスク処理と併用しても信頼度が適切に反映される仕組を考察した.話者適応による改善も確認できた.音響モデルを話者適応と分離歪とに適応すると話者間が中程度(40〜60度)の時に精度改善が大きく,ソフトマスクで更に精度が改善される結果となった.話者間角度が50度以上あれば約80%以上の比較的高い精度を達成可能なことを示唆できた.音響モデル適応とソフトマスク処理により複数話者のコミュニケーションにおいて人間とロボットの立ち位置の自由度を高めることができた.今後の課題は,教師なし適応の性能評価などがある.
机译:可以肯定的是,将软掩膜应用于适于分离失真的声学模型可以提高识别精度;即使在将声学模型应用于分离失真并与掩膜处理结合使用时,也可以适当反映可靠性的机制。当将声学模型应用于扬声器自适应和分离失真时,当扬声器之间的距离为中等(40至60度)时,精度提高很大,并且使用软掩膜可以进一步提高精度。如果扬声器与扬声器之间的夹角为50度或更高,则可以达到80%或更高的相对较高的精度,我们能够提高人和机器人在通信中的站立位置的自由度,未来的任务包括无监督适应的性能评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号