首页> 外文期刊>電子情報通信学会論文誌 >話者方位推定を利用した動的時間頸域刬理に基づく遠隔発話区間検出
【24h】

話者方位推定を利用した動的時間頸域刬理に基づく遠隔発話区間検出

机译:基于说话人方位估计的动态时态颈部意识的远程通话间隔检测

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

雑音下で観測された信号から音声を検出する発話区間検出は,頑健な音声入力を行うために必要不rn可欠な技術である.本論文では雑音に頑健な発話区間検出を実現するために,2チャネルマイクロホンアレーのrn観測信号から得られる空間特徴量と時間特徴量を併せて利用する手法を提案する.提案手法ではまず,WCSPrn(Weighted Cross-power Spectrum Phase)法と最ゆう推定法によって話者方位を推定し,音声の空間信頼度とrn空間分散度の二つの空間特徴量を観測信号から抽出する.そして,空間信頼度と空間分散度に基づいて振幅レベrnルしきい値とゼロ交差回数しきい値/エネルギーレベルしきい値を動的に制御する適応ゼロ交差検出法/適応短時rn間エネルギーしきい値法によって発話区間を検出する.定常無指向性雑音,定常指向性雑音と突発指向性雑音がrn混在する実騒音環境における評価実験の結果,空間特徴量と時間特徴量を用いた提案手法は,空間/時間特徴量をrn単独で用いた従来手法やETSI(the European Telecommunications Standards Institute)の標準化手法AFErn(Advanced Front End)よりも高い発話区間検出性能を得られることが確認できた.
机译:语音间隔检测可从在噪声下观察到的信号中检测语音,这对于语音输入的鲁棒性至关重要。在本文中,我们提出了一种方法,该方法使用从两通道麦克风阵列的rn个观察信号获得的空间和时间特征,以实现鲁棒的语音检测。在提出的方法中,首先,通过WCSPrn(加权交叉功率谱相位)方法和最大似然估计方法估计说话者的方位,并从观察到的信号中提取语音空间可靠性和rn空间分散的两个空间特征。 。然后,使用了基于空间可靠性和空间分散度来动态地控制振幅水平阈值和过零频率阈值/能量水平阈值的自适应过零检测方法/自适应短时能量。通过阈值方法检测发声区间。在混合了固定全向噪声,固定定向噪声和突然定向噪声的真实噪声环境中进行的评估实验结果表明,所提出的利用空间特征和时间特征的方法表明,空间/时间特征是单独存在的。可以确定的是,语音段检测性能高于第2节中使用的常规方法和ETSI(欧洲电信标准协会)的标准化方法AFErn(高级前端)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号