...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース
【24h】

孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース

机译:反隔离字识别和组织内部名称音频输入接口基于组合使用连续基本字识别

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,高頻度単語と短い単語(基本単語)を併用した音声認識を用いた組織名入力インタフェースを提案する.これは,まず音声で組織名を入力し,音声認識の結果得られた複数の単語·基本単語候補から,ペンタッチで選択,入力するマルチモーダルインタフェースである.組織名といった語彙サイズが大きく,常に新しい組織名が生み出されるため,すべてを登録することが難しく,また音声認識が難しいタスクに対し,単語認識と連続基本単語認識を併用するもので,認識対象のカバー率と認識性能,入力効率の両方の向上を図った.そして,その認識結果から単語·基本単語系列候補,基本単語候補をタッチパネルに表示し,ペンタッチにより簡単に選択して入力が可能な組織名入力インタフェースを考案した.この高頻度単語と基本単語を併用した音声認識をオフラインの認識実験により評価したところ,それぞれ単独での音声認識結果より良い結果が得られた.さらにこの認識結果に基づいてインタフェースを用いた場合の入力可能な割合をシミュレーションすると,約92%で入力が可能となることが分かった.また,このインタフェースを実装してオンラインで被験者実験を行ったところ,音声認識性能の低下で1回の発声では83.3%の入力可能率となったが,2回まで音声入力を許すことで93.3%となった.
机译:在本文中,我们建议使用高频字和短字(基本单词)使用语音识别的组织名称输入接口。这是一种多模态接口,通过语音输入组织名称,并从语音识别的结果获得的多个单词和基本词候选。因为组织名称等词汇大小的数量很大,并且始终创建一个新的组织名称,所以很难注册所有内容,并且对于难以语音识别的任务,单词识别和连续的基本字识别一起使用,我们提高了覆盖率和识别性能和输入效率。然后,从识别结果中,单词/基本字序列候选者,基本字候选显示在触摸面板上,并且设计了可以通过笔触摸和输入容易地选择的组织名称输入接口。当通过离线识别实验协同与该高频词和基本词组合的语音识别,在语音识别中获得了良好的结果作为单一语音识别。此外,在使用基于该识别结果的接口时模拟可以输入的输入时,发现输入可以在大约92%下执行。此外,当该界面在线实施并进行主题实验时,一次演讲中的83.3%以演讲识别性能降低,但通过允许语音输入最多2次,而93.3%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号