基於音段式LMR對映之語音轉換方法的改進

机译：基于音段式LMR对映之语音转换方法的改进

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

基於線性多變量迴歸(linear multivariate regression, LMR)頻譜對映之語音轉換方法,轉換出的頻譜包絡仍然存在過度平滑(over smoothing)的現象,因此本論文研究在音段式LMR頻譜對映之前加入直方圖等化(HEQ)的處理,並且在LMR頻譜對映之後加入目標音框挑選的處理,希望藉以提升轉換出語音的品質.在此,直方圖等化處理包含兩個步驟,首先是把離散倒頻譜係數(DCC)轉換成主成分分析(PCA)係數,接者把PCA係數轉換成累積密度函數(CDF)係數；目標音框挑選則是依據一個音框的音段類別編號、及LMR對映出的DCC向量,到目標語者相同音段類別所收集的音框群中,去捜尋出距離較小的目標語者DCC向量、並且取代原先對映出的DCC向量,如此以避免發生頻譜包絡之過度平滑現象.對於直方圖等化與目標音框挑選,我們以外部(未參加模型參數訓練)平行語料來量測語音轉換之平均DCC誤差,當加入直方圖等化後會使誤差值變大一些,而當加入目標音框挑選後則會使誤差值變大得更多.不過,VR(variance ratio)值量測及主觀聽測的結果卻是相反的方向,亦即直方圖等化可使語音品質提升一些,而目標音框挑選則可使語音品質獲得更為明顯的提升.這種誤差距離值和語音品質聽測之間的不一致性,我們設法去尋找了它的原因,所找到的一個理由在内文裡說明.

机译：基于线性多变量回归(linear multivariate regression, LMR)频谱对映之语音转换方法,转换出的频谱包络仍然存在过度平滑(over smoothing)的现象,因此本论文研究在音段式LMR频谱对映之前加入直方图等化(HEQ)的处理,并且在LMR频谱对映之后加入目标音框挑选的处理,希望借以提升转换出语音的品质.在此,直方图等化处理包含两个步骤,首先是把离散倒频谱系数(DCC)转换成主成分分析(PCA)系数,接者把PCA系数转换成累积密度函数(CDF)系数;目标音框挑选则是依据一个音框的音段类别编号、及LMR对映出的DCC向量,到目标语者相同音段类别所收集的音框群中,去捜寻出距离较小的目标语者DCC向量、并且取代原先对映出的DCC向量,如此以避免发生频谱包络之过度平滑现象.对于直方图等化与目标音框挑选,我们以外部(未参加模型参数训练)平行语料来量测语音转换之平均DCC误差,当加入直方图等化后会使误差值变大一些,而当加入目标音框挑选后则会使误差值变大得更多.不过,VR(variance ratio)值量测及主观听测的结果却是相反的方向,亦即直方图等化可使语音品质提升一些,而目标音框挑选则可使语音品质获得更为明显的提升.这种误差距离值和语音品质听测之间的不一致性,我们设法去寻找了它的原因,所找到的一个理由在内文里说明.

著录项

来源
《Conference on Computational Linguistics and Speech Processing》|2013年|90-104|共15页
会议地点
作者
古鴻炎; 張家維;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
語音轉換; 線性多變量迴歸; 直方圖等化; 目標音框挑選; 離散倒頻譜係數;

机译：语音转换; 线性多变量回归; 直方图等化; 目标音框挑选; 离散倒频谱系数;

相似文献

外文文献
中文文献
专利

1. 日本語の音節構造に着目した環境音の擬音語への変換 [J] . 石原一志, 坪田康, 奥乃博, 電子情報通信学会技術研究報告. 音声. Speech . 2003,第154期

机译：以日语的音节结构为中心，将环境声音转换为拟声词
2. 日本語の音節構造に着目した環境音の擬音語への変換 [J] . 石原一志, 坪田康, 奥乃博, 電子情報通信学会技術研究報告. 音声. Speech . 2003,第154期

机译：转换环境声音专注于日语音节结构
3. 音場共有を目的とした聴知覚特性に基づくインパルス応答創成·変形手法の検討 - 音場表現語とその心理尺度値を用いた音場知覚特性の分析－ [J] . 宮崎香, 橋本雄一, 森山利彦, 電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics . 2003,第472期

机译：基于听觉特征的声场共享冲激响应创建/转换方法的检验-利用声场表达词及其心理量表值分析声场感知特征
4. 基於音段式LMR對映之語音轉換方法的改進 [C] . 古鴻炎, 張家維 Conference on Computational Linguistics and Speech Processing . 2013

机译：基于音段式LMR对映之语音转换方法的改进
5. 環境騒音暴露によるTTSの推定方法に関する基礎的研究 [D] . 伊藤, 昭好 1989

机译：环境噪声暴露估算TTS的基础研究
6. 最適性理論と規則に基づく音韻理論 : ラーディル語と現代ヘブライ語の音韻分析から [O] . Yoshimoto Yasushi, 吉本靖 2002

机译：最优理论和基于规则的语音理论：从拉迪尔和现代希伯来语的语音分析

基於音段式LMR對映之語音轉換方法的改進

摘要

著录项

相似文献

相关主题

期刊订阅