首页> 外文会议>Conference on Computational Linguistics and Speech Processing >以線性多變量迴歸來對映分段後音框之語音轉換方法
【24h】

以線性多變量迴歸來對映分段後音框之語音轉換方法

机译:以线性多变量回归来对映分段后音框之语音转换方法

获取原文

摘要

基於GMM對映之語音轉換方法常遇到的一個問題是,轉換出的頻譜包絡會發生過於平滑(over smoothing)的現象,因此本論文嘗試以線性多變量迴歸(linear multivariate regression, LMR)來建構另一種頻譜對映的方法,希望能夠改進頻譜過平滑的問題。首先,我們推導了 LMR對映矩陣的解析求解公式,然後我們錄製平行語料,採用離散倒頻譜係數作為頻譜特徵,分割語音信號成聲、韻母之音段,再使用LMR對映方法來建造出一個語音轉換系統。應用此系統,我們就可進行内部、外部之平均轉換誤差的量測,並且和傳統GMM對映法所量測出的誤差距離作比較,量測的結果顯示,本論文研究的LMR_F對映法,不論是在内部或外部之測試情況,都可以獲得比傳統GMM對映法較小的平均轉換誤差。此外,我們也進行了主觀的語音品質聽測之實驗,聽測實驗的結果顯示,我們硏究的LMR_F對映法,其轉換出的語音品值,能夠比傳統GMM對映法的稍好一些。
机译:基于GMM对映之语音转换方法常遇到的一个问题是,转换出的频谱包络会发生过于平滑(over smoothing)的现象,因此本论文尝试以线性多变量回归(linear multivariate regression, LMR)来建构另一种频谱对映的方法,希望能够改进频谱过平滑的问题。首先,我们推导了LMR对映矩阵的解析求解公式,然后我们录制平行语料,采用离散倒频谱系数作为频谱特征,分割语音信号成声、韵母之音段,再使用LMR对映方法来建造出一个语音转换系统。应用此系统,我们就可进行内部、外部之平均转换误差的量测,并且和传统GMM对映法所量测出的误差距离作比较,量测的结果显示,本论文研究的LMR_F对映法,不论是在内部或外部之测试情况,都可以获得比传统GMM对映法较小的平均转换误差。此外,我们也进行了主观的语音品质听测之实验,听测实验的结果显示,我们硏究的LMR_F对映法,其转换出的语音品值,能够比传统GMM对映法的稍好一些。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号