首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >調波構造に基づくDeep Auto Encoderを用いた残響下音声強調
【24h】

調波構造に基づくDeep Auto Encoderを用いた残響下音声強調

机译:基于谐波结构采用深自动编码器混响减持增强

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本稿では,調波構造に基づくDeep Auto Encoder(DAE)を用いた残響下音声強調手法について述べる.DAEとは回帰タスクのためのDeep Neural Network(DNN)のことである.最近,対数パワースペクトルを特徴量とし,残響が重畳された音声からクリーン音声を復元するDAEが検討されている.しかしながら,残響構造の複雑さゆえにモデルの最適化が困難となり,強調音声のスペクトル(特に調波構造)が十分に復元されない問題がある.そこで本稿では,残響音声から抽出した調波構造によりDAEの入力特徴量を拡張することで残響下音声強調の性能向上を目指す.また,調波構造を正確に抽出するため,連続スペクトル減算により残響に頑健なFO推定を検討する.最後に,提案手法の有効性を確認するため客観評価実験を実施した.客観評価実験では,調波構造の抽出精度を評価した後,強調音声の音声品質をPESQによって評価した.実験の結果より,入力特徴量に調波構造を追加することでPESQスコアが改善し,高い音声品質を保持できることを確認した.
机译:在本文中,我们描述了基于谐波结构的深自动编码器(DAE)的混响语音增强方法。 Dae是一个回归任务的深神经网络(DNN)。最近,DAE被认为是从具有对数功率谱的语音恢复清洁语音,作为叠加的特征量和混响。然而,由于混响结构的复杂性,难以优化模型,并且存在强调语音(特别是谐波结构)的频谱不充分恢复的问题。在本文中,我们旨在通过从混响的声音提取的谐波结构扩展DAE输入特征量来提高混响语音增强的性能。另外,为了精确提取谐波结构,我们将考虑通过连续光谱减法来考虑鲁棒率。最后,进行了观察评估实验以确认所提出的方法的有效性。在客观评估实验中,在评估谐波结构的提取精度之后,通过PESQ评估了强调演讲的语音质量。从实验结果中,证实通过向输入特征量增加谐波结构并且可以保持高音质量来改善PesQ得分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号