任意の話者を対象とする統計的声質変換・制御法

戸田　智基

首页> 外文期刊>電子情報通信学会技術研究報告 >任意の話者を対象とする統計的声質変換・制御法

【24h】

任意の話者を対象とする統計的声質変換・制御法

机译：任何说话者的统计语音质量转换和控制方法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

声質変換は，言語情報を保存したまま話者性等の非言語情報を変換する技術である．従来の統計的手法に基づく枠組みでは，入力話者と出力話者が同一内容を発声しているパラレルデータを数十文程度用いて，特定話者対を対象とした変換モデルを事前に学習する必要がある．我々は，この制約を大きく緩和する枠組みとして，任意の話者を対象とした声質変換技術の研究開発に取り組んでいる．多数の異なる話者の音声データを有効利用することで，任意の話者からある特定の話者への変換（多対一声質変換）と，ある特定の話者から任意の話者への変換（一対多声質変換）が可能となる．本報告では，これらの変換を実現する技術について紹介する．%Voice conversion (VC) is a technique to modify nonlinguistic information such as voice characteristics while keeping linguistic information unchanged. In the traditional VC framework, we need to train a conversion model for a specific input and output speaker-pair using a parallel data set consisting of dozens of utterance-pairs of those two speakers. To make VC technologies more practical, we study a novel VC framework effectively using speech samples of many different speakers for flexibly developing the conversion models for arbitrary speakers. We have hitherto proposed many-to-one VC allowing the conversion from a specific speaker's voice into an arbitrary speaker's voice and one-to-many VC vice versa. This paper describes our attempts to develop these VC technologies.

机译：语音质量转换是一种在保留语言信息的同时转换非语言信息（例如说话者特征）的技术。在基于常规统计方法的框架中，通过使用几十个并行数据的句子来预先学习针对特定讲话者对的转换模型，其中输入讲话者和输出讲话者说出相同的内容。有必要。我们正在研究和开发适用于任何扬声器的语音转换技术，以此为框架来大大放松这一限制。通过有效地使用许多不同扬声器的语音数据，从任意扬声器转换为特定扬声器（多对一语音转换）以及从特定扬声器转换为任意扬声器（一对多语音质量转换）是可能的。在此报告中，我们介绍了实现这些转换的技术。语音转换（VC）是一种在保持语言信息不变的情况下修改语音信息等非语言信息的技术。在传统的VC框架中，我们需要使用并行数据集为特定的输入和输出扬声器对训练转换模型为了使VC技术更加实用，我们有效地研究了一个新颖的VC框架，该框架使用了许多不同说话者的语音样本来灵活地开发任意说话者的转换模型。迄今为止，我们已经提出了这两个说话者的许多语音对，其中包括数十对语音对。 -一个VC允许从特定讲话者的语音转换为任意讲话者的语音，反之亦然。一对多VC反之亦然。本文介绍了我们开发这些VC技术的尝试。

著录项

来源
《電子情報通信学会技術研究報告》 |2009年第422期|p.73-78|共6页
作者
戸田　智基;
展开▼
作者单位

奈良先端科学技術大学院大学　情報科学研究科　〒630-0192奈良県生駒市高山町8916-5;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
声質変換; 声質制御; 一対多変換; 多対一変換; 固有声;

机译：语音质量转换;语音质量控制;一对多转换;多对一转换;特征语音;
入库时间 2022-08-18 00:35:13

相似文献

外文文献
中文文献
专利

1. 任意の話者を対象とする統計的声質変換·制御法 [J] . 戸田智基電子情報通信学会技術研究報告. 音声. Speech . 2008,第422期

机译：任何说话者的统计语音转换和控制方法
2. 任意の話者を対象とする統計的声質変換·制御法 [J] . 戸田智基電子情報通信学会技術研究報告. 音声. Speech . 2008,第422期

机译：任何扬声器的统计语音变换和控制方法
3. 空調試運転時を対象とした実測・数億シミュレーションによる自然換気量評価: 流量制御機能を有する給排気口を設置したオフィスビルにおける自然換気及び空調システムの併用手法に関する研究（第一報） [J] . 安永龍一, 芦谷友美, 白石靖幸, 日本建築学会環境系論文集 . 2012,第678期

机译：在空调测试操作过程中通过实际测量和数亿次模拟评估自然通风：在具有送风和排气口且具有流量控制功能的办公楼中自然通风和空调系统的组合使用研究（第一份报告）
4. 住宅を対象とした効率的な換気制御手法に関する研究その３　換気経路及び換気量を変化させた場合の汚染質排出効率の検討 [C] . 有波裕貴, 赤林伸一, 須田周史, 日本建築学会大会;日本建築学会 . 2020

机译：高效通风控制方法的研究部件3污染效率的污染效率及通风
5. 非最小位相制御対象の2自由度構成によるロバスト制御利用統計を見る [D] . 川邊武俊 1994

机译：查看具有非最小相位控制对象的2-DOF配置的强大控件使用统计信息
6. 〔民事手続判例研究〕仮処分命令における保全すべき権利が、本案訴訟の判決において、当該仮処分命令の発令時から存在しなかったものと判断され、このことが事情の変更に当たるとして当該仮処分命令を取り消す旨の決定が確定した場合には、当該仮処分命令を受けた債務者は、その保全執行としてされた間接強制決定に基づき取り立てられた金銭につき、債権者に対して不当利得返還請求をすることができるとした事例損害賠償等請求事件 (最高裁平成20年(受)第224号、平成21年4月24日第二小法廷判決・上告棄却、民集63巻4号765頁、裁時1482号12頁、判時2046号79頁、判タ1299号144頁、金法1874号155頁、金商1338号36頁) [O] . 金炳学 2011

机译：民事诉讼程序案例研究在本案判决书中，从发布临时处分令之时起，就判定不存在保留在临时处分令中的权利，并且由于改变了情况而取消了临时处分令。如果最终确定该决定，则收到临时处置令的债务人可以要求债权人根据作为保护执行而做出的间接强制性决定，退还与所收取款项有关的不当收益。要求损害赔偿的案件（最高法院第224（2008）号（收到）第224号，2009年4月24日，第二小法院的判决/上诉驳回，民述第63卷第4号第765页，第1482号判决）（第12号，第2046、79，J.1299、144，Kinho 1874、155，Kinsho 1338、36）

任意の話者を対象とする統計的声質変換・制御法

摘要

著录项

相似文献

相关主题

期刊订阅