孤立単語音声認識を用いた雑音ロバストキーワードスポッティング

高橋　亘; 宮永　喜一

首页> 外文期刊>電子情報通信学会技術研究報告 >孤立単語音声認識を用いた雑音ロバストキーワードスポッティング

【24h】

孤立単語音声認識を用いた雑音ロバストキーワードスポッティング

机译：使用隔离词语音识别的噪声健壮关键词发现

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本研究では，雑書環境下での連続音声からキーワードスポッティングを行った．提案手法は雑音ロバスト孤立単語音声認識を連続音声に適用することでキーワードを抽出する．この手法ではハードウェアの構成法である超並列処理を用いることで実時間での処理を目指している．本研究ではこの手法を超並列苦声認識と呼ぶ．連続音声を複数の区間に分割し．それぞれの区間に単語音声認識を処理することでキーワードの区間を推定することができる．また，キーワードスポッティングを行う際，キーワード以外の音声や非音声を認識結果としては認識精度が下がる．よって，それらの結果を棄却する処理が必要となる．棄却処理には認識処理で得られる尤度を用いて棄却するかを判定する．超並列音声認識を行うことで複数の認識結果が得られるため，これらの情報を総合しすることで棄却処理の信頼性を向上させることができる．超並列音声認識によるキーワードスポッティングを行った結果，雑書環境下でも高い認識率を得ることができた．%In this report, we performed a keyword spotting from cotinuous speech under noisy environments. The proposed algorithm is based on the robust isolated word recognition and it is applied for the continuous speech. Super parallel calculation mechanism is embedded into the proposed method. We can realize real time processing using its parallel structure in a hardware system. This paper calls super-parallel automatic speech recognition (SP-ASR). The method can estimate the section of the keywords and recognize it from continuous speech. If a speech except the keywords and non-speech are given during this recognition, the recognition accuracy is degraded. Therefore, the new processing which rejects the unsuitable results is necessary.By using the likelihoods into speech recognition, the new rejection algorism is implemented. Some recognition results are computed by SP-ASR and the reliability of the recognition and the rejection can be improved. We finally show a result that high recognition ratio could be obtained by performing keyword spotting in SP-ASR from continuous speech under noisy environments.

机译：在这项研究中，我们从其他书籍环境中的连续语音中进行了关键字识别。所提出的方法通过将噪声鲁棒的隔离词语音识别应用于连续语音来提取关键字。此方法旨在通过使用大规模并行处理（一种硬件配置方法）进行实时处理。在这项研究中，这种方法称为大规模并行咬合识别。将连续语音分为多个部分。可以通过在每个段中处理单词语音识别来估计关键字段。另外，当执行关键词发现时，降低了关键词之外的语音和非语音的识别精度。因此，拒绝这些结果的过程是必要的。在拒绝过程中，在识别过程中获得的似然度用于确定是否拒绝。由于可以通过执行大规模并行语音识别获得多个识别结果，因此可以通过集成这些信息来提高拒绝过程的可靠性。通过大规模并行语音识别发现关键字，即使在其他书籍环境中也可以获得很高的识别率。％在本报告中，我们在嘈杂的环境下从连续语音中进行了关键字识别。该算法基于鲁棒的隔离词识别，并且适用于连续语音。该方法中嵌入了超并行计算机制。这种实时处理是在硬件系统中使用其并行结构进行的。本文称为超并行自动语音识别（SP-ASR）。该方法可以估计关键字的部分并从连续语音中识别出来。在识别过程中给出了非语音信息，降低了识别精度。因此，有必要对拒绝不合适的结果进行新的处理。通过将似然性用于语音识别，实现新的拒绝算法。可以提高SP-ASR的识别和拒绝的可靠性。通过在嘈杂的环境中从连续语音中在SP-ASR中执行关键字发现，可以获得n比。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第210期|p.105-109|共5页
作者
高橋　亘; 宮永　喜一;
展开▼
作者单位

北海道大学大学院情報科学研究科　〒060-8628北海道札幌市北区北14条西9丁目;

北海道大学大学院情報科学研究科　〒060-8628北海道札幌市北区北14条西9丁目;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
キーワードスポッティング; 音声認識; 雑音ロバスト; 棄却;

机译：关键词发现;语音识别;噪声鲁棒性;拒绝;
入库时间 2022-08-18 00:31:03

相似文献

外文文献
中文文献
专利

1. 孤立単語音声認識を用いた雑音ロバストキーワードスポッティング [J] . 高橋亘, 宮永喜一電子情報通信学会技術研究報告. スマートインフォメディアシステム . 2011,第210期

机译：使用隔离词语音识别的抗噪鲁棒性关键词识别
2. 孤立単語音声認識を用いた雑音ロバストキーワードスポッティング [J] . 高橋亘, 宮永喜一電子情報通信学会技術研究報告. スマートインフォメディアシステム . 2011,第210期

机译：噪声Labste keu词使用隔绝的词语音识别
3. 推定SNRに基づくスペクトル領域フィルタリングを用いた雑音に頑健な孤立単語音声認識 [J] . 早坂　昇, 吉澤　真吾, 宮永　喜一電子情報通信学会論文誌 . 2006,第10期

机译：基于估计信噪比的谱域滤波的鲁棒隔离词语音识别
4. 雑音にロバストな音声認識システムのためのランニングスペクトル分析を用いた自動音声区間検出 [C] . 中越達也, 早坂昇, 筒井弘, 電子情報通信学会;電子情報通信学会総合大会 . 2019

机译：带有运行频谱分析的自动语音间隔检测，用于噪声健壮的语音识别系统
5. 熱拡散法を用いたヘテロバイポーラトランジスタ構造キャリア注入型光スイッチ作製に関する研究利用統計を見る [D] . 西川剛志 1995

机译：热扩散法制备异质双极晶体管结构的载流子注入型光开关的研究
6. キョウドウケンキュウリアルタイムエイゾウブンセキオヨビコンピュータグラフィックスオモチイタスポーツウンドウガクシュウノタメノシカクテキフィードバックシステムノケンキュウダイ1ホウテニスノラリーパターンブンセキシステムノシサク [O] . 石井政弘, 杉下和夫, 江森康文, 1995

机译：Kyodo Kenkyu实时Eizou Bunseki Oyobi计算机图形学Omoichita体育撤消Gakushu No Tame no shichikaku反馈系统No Kenkyu Dai 1 Hou网球Norari模式Bunseki系统没有shisaku

孤立単語音声認識を用いた雑音ロバストキーワードスポッティング

摘要

著录项

相似文献

相关主题

期刊订阅