【24h】

汎用PC上で利用された音声対話システムによる苫声収集と評価

机译:收集和评估general通用计算机上使用的语音对话系统的语音

获取原文
获取原文并翻译 | 示例
           

摘要

実際の利用環境に近づけた被験者実験を行うために,WWW経由でカスタマイズ可能な害声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される,本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.
机译:我们通过WWW构建了可定制的语音对话系统及其数据收集系统,以进行更接近实际使用环境的主题实验。该系统的用户可以在自己的PC上安装和使用语音识别系统。为了支持数量不确定的用户,每个用户都可以在Internet上准备的远程服务器上自定义此系统。另外,使用该系统的每个用户的PC上记录的语音数据通过互联网被发送到远程服务器,通过使用该系统,可以获得在实际环境中多个用户使用语音识别系统时的数据。可以收集。在本文中,我们实际上使用该系统进行了现场测试,以收集和分析数据。它已在Internet上发布,并在2个月内收集了59个小时的数据,其中约5个小时41分钟的数据(11351)被检测为音频部分。作为识别实验的结果,当使用从检测到的语音数据向系统发出的语音数据4716语音作为评估数据,并且对每个用户应用无监督的MLLR自适应时,单词的准确率为66.0%。单词准确率提高到70.5%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号