首页> 外文会议>Conference on Computational Linguistics and Speech Processing >基於音段式LMR對映之語音轉換方法的改進
【24h】

基於音段式LMR對映之語音轉換方法的改進

机译:基于音段式LMR对映之语音转换方法的改进

获取原文

摘要

基於線性多變量迴歸(linear multivariate regression, LMR)頻譜對映之語音轉換方法,轉換出的頻譜包絡仍然存在過度平滑(over smoothing)的現象,因此本論文研究在音段式LMR頻譜對映之前加入直方圖等化(HEQ)的處理,並且在LMR頻譜對映之後加入目標音框挑選的處理,希望藉以提升轉換出語音的品質.在此,直方圖等化處理包含兩個步驟,首先是把離散倒頻譜係數(DCC)轉換成主成分分析(PCA)係數,接者把PCA係數轉換成累積密度函數(CDF)係數;目標音框挑選則是依據一個音框的音段類別編號、及LMR對映出的DCC向量,到目標語者相同音段類別所收集的音框群中,去捜尋出距離較小的目標語者DCC向量、並且取代原先對映出的DCC向量,如此以避免發生頻譜包絡之過度平滑現象.對於直方圖等化與目標音框挑選,我們以外部(未參加模型參數訓練)平行語料來量測語音轉換之平均DCC誤差,當加入直方圖等化後會使誤差值變大一些,而當加入目標音框挑選後則會使誤差值變大得更多.不過,VR(variance ratio)值量測及主觀聽測的結果卻是相反的方向,亦即直方圖等化可使語音品質提升一些,而目標音框挑選則可使語音品質獲得更為明顯的提升.這種誤差距離值和語音品質聽測之間的不一致性,我們設法去尋找了它的原因,所找到的一個理由在内文裡說明.
机译:基于线性多变量回归(linear multivariate regression, LMR)频谱对映之语音转换方法,转换出的频谱包络仍然存在过度平滑(over smoothing)的现象,因此本论文研究在音段式LMR频谱对映之前加入直方图等化(HEQ)的处理,并且在LMR频谱对映之后加入目标音框挑选的处理,希望借以提升转换出语音的品质.在此,直方图等化处理包含两个步骤,首先是把离散倒频谱系数(DCC)转换成主成分分析(PCA)系数,接者把PCA系数转换成累积密度函数(CDF)系数;目标音框挑选则是依据一个音框的音段类别编号、及LMR对映出的DCC向量,到目标语者相同音段类别所收集的音框群中,去捜寻出距离较小的目标语者DCC向量、并且取代原先对映出的DCC向量,如此以避免发生频谱包络之过度平滑现象.对于直方图等化与目标音框挑选,我们以外部(未参加模型参数训练)平行语料来量测语音转换之平均DCC误差,当加入直方图等化后会使误差值变大一些,而当加入目标音框挑选后则会使误差值变大得更多.不过,VR(variance ratio)值量测及主观听测的结果却是相反的方向,亦即直方图等化可使语音品质提升一些,而目标音框挑选则可使语音品质获得更为明显的提升.这种误差距离值和语音品质听测之间的不一致性,我们设法去寻找了它的原因,所找到的一个理由在内文里说明.

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号