首页> 外文期刊>電子情報通信学会技術研究報告 >孤立単語音声認識を用いた雑音ロバストキーワードスポッティング
【24h】

孤立単語音声認識を用いた雑音ロバストキーワードスポッティング

机译:使用隔离词语音识别的噪声健壮关键词发现

获取原文
获取原文并翻译 | 示例
       

摘要

本研究では,雑書環境下での連続音声からキーワードスポッティングを行った.提案手法は雑音ロバスト孤立単語音声認識を連続音声に適用することでキーワードを抽出する.この手法ではハードウェアの構成法である超並列処理を用いることで実時間での処理を目指している.本研究ではこの手法を超並列苦声認識と呼ぶ.連続音声を複数の区間に分割し.それぞれの区間に単語音声認識を処理することでキーワードの区間を推定することができる.また,キーワードスポッティングを行う際,キーワード以外の音声や非音声を認識結果としては認識精度が下がる.よって,それらの結果を棄却する処理が必要となる.棄却処理には認識処理で得られる尤度を用いて棄却するかを判定する.超並列音声認識を行うことで複数の認識結果が得られるため,これらの情報を総合しすることで棄却処理の信頼性を向上させることができる.超並列音声認識によるキーワードスポッティングを行った結果,雑書環境下でも高い認識率を得ることができた.%In this report, we performed a keyword spotting from cotinuous speech under noisy environments. The proposed algorithm is based on the robust isolated word recognition and it is applied for the continuous speech. Super parallel calculation mechanism is embedded into the proposed method. We can realize real time processing using its parallel structure in a hardware system. This paper calls super-parallel automatic speech recognition (SP-ASR). The method can estimate the section of the keywords and recognize it from continuous speech. If a speech except the keywords and non-speech are given during this recognition, the recognition accuracy is degraded. Therefore, the new processing which rejects the unsuitable results is necessary.By using the likelihoods into speech recognition, the new rejection algorism is implemented. Some recognition results are computed by SP-ASR and the reliability of the recognition and the rejection can be improved. We finally show a result that high recognition ratio could be obtained by performing keyword spotting in SP-ASR from continuous speech under noisy environments.
机译:在这项研究中,我们从其他书籍环境中的连续语音中进行了关键字识别。所提出的方法通过将噪声鲁棒的隔离词语音识别应用于连续语音来提取关键字。此方法旨在通过使用大规模并行处理(一种硬件配置方法)进行实时处理。在这项研究中,这种方法称为大规模并行咬合识别。将连续语音分为多个部分。可以通过在每个段中处理单词语音识别来估计关键字段。另外,当执行关键词发现时,降低了关键词之外的语音和非语音的识别精度。因此,拒绝这些结果的过程是必要的。在拒绝过程中,在识别过程中获得的似然度用于确定是否拒绝。由于可以通过执行大规模并行语音识别获得多个识别结果,因此可以通过集成这些信息来提高拒绝过程的可靠性。通过大规模并行语音识别发现关键字,即使在其他书籍环境中也可以获得很高的识别率。 %在本报告中,我们在嘈杂的环境下从连续语音中进行了关键字识别。该算法基于鲁棒的隔离词识别,并且适用于连续语音。该方法中嵌入了超并行计算机制。这种实时处理是在硬件系统中使用其并行结构进行的。本文称为超并行自动语音识别(SP-ASR)。该方法可以估计关键字的部分并从连续语音中识别出来。在识别过程中给出了非语音信息,降低了识别精度。因此,有必要对拒绝不合适的结果进行新的处理。通过将似然性用于语音识别,实现新的拒绝算法。可以提高SP-ASR的识别和拒绝的可靠性。通过在嘈杂的环境中从连续语音中在SP-ASR中执行关键字发现,可以获得n比。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号