机译:在语音合成和语音增强中,已经关注通过通过从估计的幅度谱\ r \ n频谱图估计相位来执行相位恢复来重新合成时域信号的方法。 \ r \ n基于短时傅立叶变换(STFT)的属性的格里芬-林方法(r方法)(r方法)已被广泛用于相位恢复,但是重新组合优质时域信号需要大量迭代,并且存在一个问题,即使增加了重新反转的次数,复合信号的质量也不会始终得到改善。 。在本文中,我们提出了一种将深度神经网络(DNN)纳入GL方法的迭代相位重建方法。可以证实,与GL方法相比,语音幅度谱图中的相位恢复\ r \ n可以改善合成信号的质量。
展开▼