首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >共通部分単語の提示を併用した単語音声入力インタフェース
【24h】

共通部分単語の提示を併用した単語音声入力インタフェース

机译:具有共同的部分单词表示的单词语音输入界面

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

大語彙の単語(キーワード)入力タスクに対し,認識精度の影響による入力効率の低下を抑えることを目標としたGUI併用の音声入力インタフェースを提案する.この音声入力インタフェースは,発話の認識結果をもとに生成される複数候補リストを利用者に提示し,そこから利用者が選択するGUI(Graphical User Interface)の仕組みを併用することを前提とする.この様なユーザインタフェースシステムの有効性は認識結果のN-best,候補のみを提示する場合,その有効性は音声認識システムの利用者や環境による認識精度の違いに大きく影響される.我らの方法は,認識性能が高くない意環境下での入力効率を向上させるため,GUIとして提示される複数候補の中に,一般的な認識結果のN-best候補だけでなく検索(絞り込み)候補を含めるアプローチに基づく.検索候補は,事前に定義された共通部分単語とN-best出力結果から動的に作成される.本稿では,共通部分単語の定義や,表示する候補リストの構成法の違いによる性能比較について報告する.雑音環境を想定した約13000語の単語入力タスクに対して評価実験を行った結果,提案するインタフェースは認識結果のN-best候補のみを提示するベースライン手法を上回る性能を示し,入力の効率が改善された.一方,共通部分単語や構成法の違いはインタフェースの性能に影響を与えるが,いずれもベースライン手法より高い性能を示した.
机译:我们提出了一种具有GUI的语音输入界面,该界面旨在抑制由于对大词汇量中的单词(关键字)输入任务的识别准确度的影响而导致的输入效率下降。该语音输入接口的前提是向用户呈现基于语音的识别结果而生成的多个候选列表,并且还使用用户从列表中选择的GUI(图形用户界面)机制。 ..当仅呈现N个最佳识别结果和候选者时,取决于语音识别系统的用户和环境的识别精度的差异极大地影响了这种用户界面系统的有效性。为了在识别性能不高的环境中提高输入效率,我们的方法不仅在显示为GUI的多个候选中搜索(缩小)一般识别结果的N个最佳候选。基于包括候选人的方法。搜索候选是根据预定义的公共子词和N个最佳输出结果动态创建的。在本文中,我们报告了常见子词的定义以及由于要显示的候选列表的构造方法不同而导致的性能比较。假设在嘈杂的环境中对大约13000个单词的单词输入任务进行了评估实验,结果表明,与仅提供N个最佳候选识别结果的基线方法相比,所提出的界面表现出更好的性能,并且输入效率很高。改善了。另一方面,常见子词和构造方法的差异会影响界面的性能,但它们均显示出比基线方法更高的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号