机译:使用低/多频率STFT振幅谱的无声码合成语音合成网络
Univ Tokyo, Grad Sch Informat Sci & Technol, Bunkyo Ku, 7-3-1 Hongo, Tokyo 1138656, Japan;
Univ Tokyo, Grad Sch Informat Sci & Technol, Bunkyo Ku, 7-3-1 Hongo, Tokyo 1138656, Japan;
Univ Tokyo, Grad Sch Informat Sci & Technol, Bunkyo Ku, 7-3-1 Hongo, Tokyo 1138656, Japan;
Vocoder-free text-to-speech; Training algorithm; STFT amplitude spectra; Generative adversarial networks; Frequency resolution; Frequency warping;
机译:无声码的文本到语音合成,使用低/多频谱幅度谱结合生成的对抗网络
机译:包含生成对抗网络的统计参数语音合成
机译:使用条件生成对抗网络从SAR /光学多时相数据合成多光谱光学图像
机译:基于低/多分辨率生成对冲网络的STFT光谱进行文本与语音合成
机译:图像合成的对抗网络
机译:基于多判别生成对抗网络的高光谱图像分类方法
机译:使用俯仰同步多尺度生成对抗网络进行文本与语音合成的波形生成