以線性多變量迴歸來對映分段後音框之語音轉換方法

机译：以线性多变量回归来对映分段后音框之语音转换方法

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

基於GMM對映之語音轉換方法常遇到的一個問題是，轉換出的頻譜包絡會發生過於平滑(over smoothing)的現象，因此本論文嘗試以線性多變量迴歸(linear multivariate regression, LMR)來建構另一種頻譜對映的方法，希望能夠改進頻譜過平滑的問題。首先，我們推導了 LMR對映矩陣的解析求解公式，然後我們錄製平行語料，採用離散倒頻譜係數作為頻譜特徵，分割語音信號成聲、韻母之音段，再使用LMR對映方法來建造出一個語音轉換系統。應用此系統，我們就可進行内部、外部之平均轉換誤差的量測，並且和傳統GMM對映法所量測出的誤差距離作比較，量測的結果顯示，本論文研究的LMR_F對映法，不論是在内部或外部之測試情況，都可以獲得比傳統GMM對映法較小的平均轉換誤差。此外，我們也進行了主觀的語音品質聽測之實驗，聽測實驗的結果顯示，我們硏究的LMR_F對映法，其轉換出的語音品值，能夠比傳統GMM對映法的稍好一些。

机译：基于GMM对映之语音转换方法常遇到的一个问题是，转换出的频谱包络会发生过于平滑(over smoothing)的现象，因此本论文尝试以线性多变量回归(linear multivariate regression, LMR)来建构另一种频谱对映的方法，希望能够改进频谱过平滑的问题。首先，我们推导了LMR对映矩阵的解析求解公式，然后我们录制平行语料，采用离散倒频谱系数作为频谱特征，分割语音信号成声、韵母之音段，再使用LMR对映方法来建造出一个语音转换系统。应用此系统，我们就可进行内部、外部之平均转换误差的量测，并且和传统GMM对映法所量测出的误差距离作比较，量测的结果显示，本论文研究的LMR_F对映法，不论是在内部或外部之测试情况，都可以获得比传统GMM对映法较小的平均转换误差。此外，我们也进行了主观的语音品质听测之实验，听测实验的结果显示，我们硏究的LMR_F对映法，其转换出的语音品值，能够比传统GMM对映法的稍好一些。

著录项

来源
《Conference on Computational Linguistics and Speech Processing》|2012年|3-14|共12页
会议地点
作者
古鴻炎; 張家維; 王讚緯;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
語音轉換; 線性多變量迴歸; 高斯混合模型; 離散倒頻譜係數;

机译：语音转换; 线性多变量回归; 高斯混合模型; 离散倒频谱系数;
入库时间 2022-08-26 15:11:26

相似文献

外文文献
中文文献
专利

1. 突発性難聴純音聴力固定後の語音弁別能、ABR、 THIの変化 [J] . 野口佳裕、高橋正時、戸叶尚史、西尾綾子、山本桂、澤田光毅、喜多村健 Audiology Japan . 2012,第5期

机译：突然的听力损失纯净的声音固视后语音识别能力，ABR和THI发生变化
2. 突発性難聴純音聴力固定後の語音弁別能、ABR、 THIの変化 [J] . 野口佳裕、高橋正時、戸叶尚史、西尾綾子、山本桂、澤田光毅、喜多村健 Audiology Japan . 2012,第5期

机译：突然耳聋纯粹探测力固定灯声音残疾能力，ABL，THI变化
3. 高次統計量を基にする騒音フレーム検出及び線形予測による突発性騒音抑圧 [J] . 米山雄統, 笹岡直人, 伊藤良生電子情報通信学会技術研究報告. スマートインフォメディアシステム . 2017,第70期

机译：基于高阶统计的噪声帧检测和线性预测突然噪声抑制
4. 基於音段式LMR對映之語音轉換方法的改進 [C] . 古鴻炎, 張家維 Conference on Computational Linguistics and Speech Processing . 2013

机译：基于音段式LMR对映之语音转换方法的改进
5. X線映画法による構音運動の解析（特に正常者ならびに口蓋裂術後患者について） [D] . 和田, 卓郎 -1

机译：X射线胶片法分析关节运动（特别是正常受试者和subjects裂后的患者）
6. 原始納西語前冠音的來源與演變 [O] . 李子鶴 2020

机译：原始纳西语前冠音的来源与演变

以線性多變量迴歸來對映分段後音框之語音轉換方法

摘要

著录项

相似文献

相关主题

期刊订阅