首页> 外文期刊>電子情報通信学会技術研究報告 >共通部分単語の提示を併用した単語音声入力インタフェース
【24h】

共通部分単語の提示を併用した単語音声入力インタフェース

机译:使用普通单词演示的单词语音输入界面

获取原文
获取原文并翻译 | 示例
           

摘要

大語彙の単語(キーワード)入力タスクに対し,認識精度の影響こよる入力効率の低下を抑えることを目標としたGUI併用の音声入力インタフェースを提案する.この音声入力インタフェースは,発話の認識結果をもとに生成される複数候補リストを利用者に提示し,そこから利用者が選択するGUI(Graphical User Interface)の仕組みを併用することを前提とする.この様なユーザインタフェースシステムの有効性は認識結果のN-best候補のみを提示する場合その有効性は音声認識システムの利用者や環境による認識精度の違いに大きく影響される.我らの方法は.認識性能が高くない悪環境下での入力効率を向上させるため,GUIとして提示される複数候補の中に,一般的な認識結果のN-best候補だけでなく検索(絞り込み)候補を含めるアプローチに基づく.検索候補は,事前に定義された共通部分単語とN-best出力結果から動的に作成される.本稿では,共通部分単語の定義や,表示する候補リストの構成法の違いによる性能比較について報告する.雑音環境を想定した約13000語の単語入力タスクに対して評価実験を行った結果,提案するインタフェースは認識結果のN-best候補のみを提示するベースライン手法を上回る性能を示し,入力の効率が改善された.一方,共通部分単語や構成法の違いはインタフェースの性能に影響を与えるが,いずれもベースライン手法より高い性能を示した.%In this paper, we propose a new user interface based on a combination of speech input and graphical user interface(GUI) to restrain decrease of input effeciency by influence of recognition accuracy. A new speech interface is based on combination using GUI which can make users select candidates from multiple candidates list made by recognition results. But, an effectiveness of these user interfaces is strongly influenced by a difference of recognition accuracy from a user or an environment with typical speech recognition systems if they simply display N-best candidates of recognition results only. To improve input effeciency under adverse conditions (where the recognition accuracy is not veryrnhigh), our method uses not only N-best candidates from the recognition result but search candidates which can narrow candidates. The search candidates are dynamically made from N-best output result and common word parts defined in advance. In this paper, we compare different methods of extracting common word parts and two methods of generating candidates list. We carried out an experiment of word input task for about 13,000 vocabulary words in several adverse conditions, and evaluated the performance of our GUI-assisted speech interface system by simulating a GUI-assisted (multimodal) isolated-word input task. As a result, the proposed systems indicated inprovement for input effeciency and performance over the baseline system. Although the difference of a definition of common word parts and a way to make candidates list influenced to performance of interface system, all of proposed systems still show better performance than the baseline's.
机译:对于大的词汇(关键字)输入任务,我们提出了一种基于GUI的语音输入界面,其目的是抑制由于识别精度的影响而导致输入效率的降低。前提是向用户呈现基于以上生成的多个候选列表,并且还使用用户选择的GUI(图形用户界面)机制,这种用户界面系统的有效性是当仅给出识别结果的N个最佳候选者时,其有效性将受到语音识别系统用户和环境的不同影响,其识别精度会有所不同。为了提高输入效率,该方法基于不仅包括一般的识别结果为N个最佳候选,而且还包括在作为GUI呈现的多个候选中搜索(缩小)候选的方法,预先定义搜索候选。由常用部分词和N个最佳输出结果动态创建,本文通过常见部分词的定义和待显示候选列表的构造方法报告性能比较。作为一项针对13000字输入任务的评估实验的结果,所提出的界面优于仅显示识别结果的N个最佳候选者的基线方法,从而提高了输入效率。常用词和构造方法的差异会影响界面的性能,但它们均显示出比基线方法更高的性能。%在本文中,我们提出了一种基于语音输入和图形结合的新用户界面。用户界面(GUI),以通过识别精度的影响来抑制输入效率的降低。基于GUI的组合的新语音界面可以使用户从识别结果制成的多个候选列表中选择候选者。如果用户界面仅显示仅N个最佳候选识别结果,则用户界面受用户或环境与典型语音识别系统的识别准确度的差异的强烈影响。在不利条件下(其中识别准确度不高)提高输入效率非常高),我们的方法不仅使用识别结果中的N个最佳候选,还使用可以缩小候选范围的搜索候选。这些搜索候选是根据N个最佳输出结果和预先定义的常用单词部分动态生成的。不同的提取常用单词部分的方法和两种生成候选列表的方法。我们在几种不利条件下对大约13,000个词汇进行了单词输入任务实验,并通过模拟GUI评估了我们的GUI辅助语音界面系统的性能辅助(多模式)隔离词输入任务。因此,所提出的系统表明对inp的改进尽管通用词部分的定义和使候选列表影响界面系统性能的方法有所不同,但所有提议的系统仍然表现出比基线更好的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号