...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >高い雑音耐性と推定精度を両立する基本周波数推定法の提案と評価
【24h】

高い雑音耐性と推定精度を両立する基本周波数推定法の提案と評価

机译:兼顾高抗扰度和估计精度的基本频率估计方法的建议和评估

获取原文
获取原文并翻译 | 示例

摘要

基本周波数(F0,最近は FO と表記することもあるが本稿では F0 に統一する)は,周期的に生じる声帯振動間隔の最も短いものの逆数として定義され,知覚する音声の高さに概ね対応する音声の主要なパラメータである.FO は様々な音声処理に利用されるパラメータであり,例えば Channel vocoder の考えに基づいた高品質音声合成では,音声から F0 を可能な限り高い精度で推定することが要求される.筆者らは,これまで高 SNR の音声を対象とした実時間処理が可能な推定法について検討し,SNR が 30 dB 以上であれば実時間処理が可能であり,かつ最新の方法と比較しても遜色ない性能が達成可能な方法を提案してきた.一方,例えば統計的音声合成では,学習に必要な音声パラメータは事前に分析しておけば良いため,実時間性よりも高い精度と雑音に対する頑健性を備えた方法が望ましいといえる.本稿では,計算速度ではなく,高い耐雑音性と推定精度にフォーカスを絞った F0 推定法 Harvestを提案する.Harvest は,音声スペクトルが調波構造を持つことに着目し,基本波に相当するピークを検出する方法を採用している.まず,高調波と低域雑音を除去するため,様々な中心周波数のバンドパスフィルタによるフィルタリングを実施し,得られた多チャネル信号から F0 の可能性がある候補を全て選定する.その後,選定された候補を瞬時周波数を用いて補正し,時系列の連続性を考えて接続することで最終的な F0 軌跡を生成する.本稿では,音声データベースを用いた評価,および筆者らが 2016 年に提案した耐雑音性評価法により提案法の有効性を示す.
机译:基本频率(F0,近来有时被称为FO,但在本文中统一为F0)被定义为最短的周期性声带振动间隔的倒数,并且大致对应于所感知的语音音高。它是语音的主要参数。 FO是用于各种语音处理的参数。例如,在基于通道声码器思想的高质量语音合成中,需要以尽可能高的准确性从语音中估计F0。作者研究了一种可以对高SNR音频进行实时处理的估计方法,如果SNR为30 dB或更高,则可以进行实时处理,并与最新方法进行比较。我们已经提出了一种可以实现与上述性能相当的性能的方法。另一方面,例如,在统计语音合成中,需要预先分析学习所需的语音参数,因此可以说,期望具有比实时特性更高的准确性和对噪声的鲁棒性的方法。在本文中,我们提出了Harvest,一种F0估计方法,该方法着重于高抗噪性和估计精度,而不是计算速度。 Harvest注意到语音频谱具有调谐结构这一事实,并采用了一种检测与基波相对应的峰值的方法。首先,为了消除谐波和低频噪声,使用各种中心频率的带通滤波器进行滤波,然后从获得的多通道信号中选择F0的所有可能候选值。此后,使用瞬时频率对选定的候选进行校正,并考虑时间序列的连续性,通过将它们连接起来来生成最终的F0轨迹。在本文中,通过使用语音数据库进行的评估和作者于2016年提出的抗噪声评估方法,证明了该方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号