首页> 外文期刊>電子情報通信学会技術研究報告 >非同期マルチチャネル信号を用いた単語音声認識のための信号強調NTPによるチャネル間同期法の検討
【24h】

非同期マルチチャネル信号を用いた単語音声認識のための信号強調NTPによるチャネル間同期法の検討

机译:信号增强NTP用于异步多通道信号单词语音识别的通道间同步方法研究

获取原文
获取原文并翻译 | 示例
           

摘要

発話訓練システム等に応用される自動音声認識システムは,周囲の発話など雑音により認識性能が劣化する。これを防ぐため,我々はこれまでTCP/IPネットワークで接続された各端末のマイクロホンを用いた音声強調手法を提案してきた。これは,各端末で得られた非同期マルチナヤネル信号をコヒーレンスを用いて遅延補正し,周波数領域でフィルタリングする手法で,これまで計算機上でのシミュレーションにより有効性が示唆されている。しかし本手法ではコヒーレンスによる遅延補正性能が安定しない問題があった。そのため,本稿では音声信号の遅延補正にNTPを用いて性能の検討を行う。提案した手法は複数話者が同時に発話する条件下で認識率を改善した。%An utterance training system utilizing automatic speech recognition (ASR) was proposed as a computer aided language laboratory system. Performance of the ASR is seriously degraded due to surround noise. A time-frequency masking method utilizing signals observed at distributed computers over TCP/IP network was proposed to overcome the problem. The lag time correction method using coherence was proposed, however, the performance was insufficient . In this paper, network time protocol (NTP) is utilized to synchronize speech signals with more precision. Accuracy of time synchronization between speech signals utilizing NTP is measured. The proposed speech enhance method improved the performance of spoken word recognition rate under multiple speakers condition.
机译:应用于语音训练系统等的自动语音识别系统由于周围的话语之类的噪声而具有较差的识别性能。为了防止这种情况,我们提出了一种使用TCP / IP网络连接的每个终端的麦克风的语音增强方法。这是一种在频域使用相干和滤波对每个终端获得的异步多通道信号进行延迟校正的方法,其有效性已通过计算机仿真得到了证明。然而,该方法具有由于相干性引起的延迟校正性能不稳定的问题。因此,在本文中,我们研究了使用NTP进行语音信号延迟补偿的性能。该方法在多个说话者同时讲话的情况下提高了识别率。提出了一种利用自动语音识别(ASR)的发声训练系统作为计算机辅助语言实验室系统,由于周围的噪声而严重降低了ASR的性能。一种利用在分布式计算机上通过TCP / IP观察到的信号的时频掩蔽方法提出了一种使用相干性的滞后时间校正方法,但性能不够。本文采用网络时间协议(NTP)对语音信号进行更高精度的同步。所提出的语音增强方法提高了多说话者条件下的语音识别率性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号