Deep Neural Networkを用いた話者空間基底への射影による声質変換

橋本哲弥; 柏木陽佑; 齋藤大輔; 峯松信明

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >Deep Neural Networkを用いた話者空間基底への射影による声質変換

【24h】

Deep Neural Networkを用いた話者空間基底への射影による声質変換

机译：使用深度神经网络通过投影到扬声器空间基础来转换语音质量

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本研究では，入出力に任意話者を用いることのできる柔軟な声質変換を目的とし，Deep Neural Network （DNN）とEigenvoice GMMs（EVGMM）の枠組みを組み合わせた変換手法を提案する．初めに大規模話者コーパスを用いてEVGMMの学習を行い，GMMの話者空間の基底ベクトル群を得る．EVGMMにおいては，この基底ベクトル群に対して目的話者に固有の重みベクトルを掛けることで目的話者のGMM平均ベクトルを決定する．提案手法では，重みベクトルとして1-of-K表現ベクトルを用いることで，話者空間を張る基底話者群のGMMを近似する．近似したGMMによって大規模コーパス中の各話者の特徴量を基底話者群の特徴量へ分解することができる．これらを用いることでDNNによって「ある話者の特徴量から基底話者群の特徴量への変換」と「基底話者群の特徴量から目的話者への変換」在の学習をそれぞれ行う．提案手法に対して，適応データ数に対する未知話者への変換精度の客観評価を行った結果，既存手法であるEVGMMを上回る精度が得られた．

机译：在这项研究中，我们提出了一种结合了深度神经网络（DNN）和本征语音GMM（EVGMM）框架的转换方法，目的是实现灵活的语音质量转换，从而允许使用任意扬声器进行输入和输出。首先，使用大规模说话人语料对EVGMM进行训练，并获得GMM说话人空间的基本向量组。在EVGMM中，通过将基本向量组乘以目标说话者唯一的权重向量，可以确定目标说话者的GMM平均向量。在提出的方法中，K的1表示向量用作权重向量，以近似扩展扬声器空间的基本扬声器组的GMM。近似的GMM可以将大型语料库中每个说话者的特征分解为基本说话者组的特征。通过使用这些，DNN分别用于学习“从某个说话者的特征量到基本说话者组的特征量的转换”和“从基本说话者组的特征量到目标说话者的转换”的存在。客观地评估了针对自适应数据的数量所提出的方法到未知说话人的转换精度，该精度高于现有方法EVGMM。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2015年第346期|共6页
作者
橋本哲弥; 柏木陽佑; 齋藤大輔; 峯松信明;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
深層学習; 声質変換; 固有声; 多対多変換;

机译：深度学习;语音质量转换;独特的语音;多对多转换;

相似文献

外文文献
中文文献
专利

1. Deep Neural Networkを用いた話者空間基底への射影による声質変換 [J] . 橋本哲弥, 柏木陽佑, 齋藤大輔, 電子情報通信学会技術研究報告. 音声. Speech . 2015,第346期

机译：使用深度神经网络通过投影到扬声器空间基础来转换语音质量
2. 吸脱着効果を考慮した室内化学物質空気汚染の空間分布?時間変動特性に関する研究 -CO_2 濃度による換気量制御を行う室内へのネットワークモデル計算へのCRI の組込み- [J] . 王立, 加藤信介日本建筑学会技术报告集 . 2017,第appa期

机译：考虑吸附和解吸作用的室内化学物质空气污染的空间分布和时变特征研究-将CRI纳入通过CO_2浓度控制通风的室内网络模型计算中
3. 朗読音声を用いたノンパラレル声質変換による変換音声の話者性と表現の評価 [J] . 電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2019,第440期

机译：使用阅读语言评估扬声器及转换语音转换语音的表达
4. 吸脱着効果を考慮した室内化学物質空気汚染の空間分布・時間変動特性に関する研究CO_2 濃度による換気量制御を行う室内へのネットワークモデル計算へのCRI の組込み [C] . 王立, 加藤信介日本建築学会;日本建築学会大会 . 2017

机译：考虑吸附/解吸效应的室内化学物质空气污染的空间分布和时变特征研究在通过CO_2浓度控制通风量的房间中将CRI纳入网络模型计算
5. スクィーズされたコヒーレント状態を用いた時間依存変分法による量子系の半古典的記述 - Berryの位相としてのMaslovの位相のあらわれ [D] . 津江, 保彦 1993

机译：压缩相干态时变分方法的量子系统半经典描述-马斯洛夫出现的贝里相
6. 25 IgA腎症における間質病変の重要性 : 色抽出による画像解析法を用いた間質面積の定量的評価(学位論文内容の要旨および審査の結果の要旨第43集) [O] . 網代晶子 2004

机译：25 IgA肾病中基质病变的重要性：使用颜色提取图像分析方法定量评估基质区域

Deep Neural Networkを用いた話者空間基底への射影による声質変換

摘要

著录项

相似文献

相关主题

期刊订阅