...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >話者方位推定を利用した動的時間領域処理に基づく遠隔発話区間検出
【24h】

話者方位推定を利用した動的時間領域処理に基づく遠隔発話区間検出

机译:基于动态时域处理的基于说话人方位估计的远程语音片段检测

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

音下で観測された信号から音声を検出する発話区間検出は,頑健な音声入力を行うために必要不 可欠な技術である。本論文では雑音に頑健な発話区間検出を実現するために,2チャネルマイクロホンアレーの 観fill信号から得られる空間特徴量と時問特徴量を併せて利用する手法を提する.提手法ではまず,WCSP (Weigh ted Cross-power Spectrum Phasse)法と最ゅう推定法によって話者方位を推定し,音声の空間信頼度と 空間分散度の二つの空間特徴量を観測信号から抽出する.そして,空間信頼度と空間分散度にIsづいて振幅レべ ルしきい値とゼロ交差回数しきい値/ エネルギーレべルしきい値を動的に
机译:语音部分检测功能可从声音下观察到的信号中检测语音,这对于稳健的语音输入来说是必不可少的技术。在本文中,我们提出了一种方法,该方法同时使用从2通道麦克风阵列的观看填充信号获得的空间特征量和时间特征量,以实现对噪声具有鲁棒性的语音片段检测。在所提出的方法中,首先通过WCSP(加权交叉功率谱相位)方法和最大估计方法估计说话者的方位,然后从观察到的信号中提取两个空间特征,即空间可靠性和语音的空间弥散。去做。然后,针对空间可靠性和空间色散,根据Is动态设置振幅水平阈值和零交叉计数阈值/能量水平阈值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号