首页> 中文学位 >基于HMM的歌词到歌声转换的研究
【6h】

基于HMM的歌词到歌声转换的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 引言

1.1 选题背景

1.2 论文结构安排

第2章 歌声合成相关语音知识

2.1 语音合成分类

2.2 文-语转换系统

2.3 基于隐马尔可夫模型的参数语音合成

2.4 说话人自适应训练

2.5 STRAIGHT算法

2.6 本章小结

第3章 歌声合成相关音乐知识

3.1 MIDI技术介绍

3.2 乐理知识介绍

3.3 语音与歌声信号特征分析

3.4 歌声旋律转换

3.5 本章小结

第4章 歌词到歌声转换的实现

4.1 HMM自适应训练

4.2 MIDI乐谱信息提取

4.3 旋律控制模型

4.4 STRAIGHT算法的歌声合成

4.5 本章小结

第5章 实验及评测

5.1 实验数据准备

5.2 系统评测

5.3 本章小结

第6章 总结与展望

6.1 论文工作总结

6.2 工作展望

参考文献

攻读学位期间的研究成果

致谢

展开▼

摘要

语音合成技术在人机交互领域是一个重要研究内容,有着广泛的应用,歌声合成是语音合成的研究热点。本研究利用了文语转换(Text-To-Speech,TTS)技术,通过HTS(HMM-based Speech Synthesis System)实现歌声的合成。利用训练语料建立说话人相关的声学模型。通过MIDI(Musical Instrument Digital Interface)乐谱,获得歌声的音乐信息。通过分析对比说话语音和歌声信号在声学特征方面的差异,建立歌声的旋律控制模型。对输入的歌词文本进行文本分析,获得上下文相关的标注,并利用训练得到的说话人相关模型,获得说话人相关的声学参数。通过旋律控制模型对声学参数进行修改。最后,利用STRAIGHT(Speech Transformation and Representation based on Adaptive Interpolation of weiGHTed spectrogram)算法实现了基于HMM(Hidden Markov Model,HMM)的歌词到歌声的转换。论文的主要工作与创新如下:
  1.建立了面向歌曲合成的基于HMM的说话人相关的声学模型。利用多说话人的语音语料,分析语音,得到基频(F0)、时长、频谱(SP)以及非周期索引(AP)等声学参数,并利用说话人自适应训练技术,训练获得平均音模型。在此基础上,利用目标说话人的语音,通过说话人自适应变换技术,得到目标说话人的声学模型。
  2.建立了旋律控制模型。从MIDI文件提取乐谱信息,分析乐谱文件结构,获得通道标号、音符音高、键的速度、音符起始时间、音符持续时间等音乐信息。分析语音和歌声在声学特征的差异,建立了歌声的旋律控制模型,包括基频控制模型和时长控制模型。利用基频控制模型将乐谱中的离散音高转换为连续的基频曲线,并利用时长控制模型获得歌唱音符的发音时长。
  3.实现了歌词到歌曲的转换。对输入的歌词文本进行文本分析,获得上下文相关的标注,并利用说话人相关的模型,生成频谱、非周期索引2个声学参数。同时根据MIDI文件,获得歌词中每个音符的音高和音长,并通过旋律控制模型获得相应的基频和时长,并根据音符时长获得音节的频谱、非周期索引和基频的时长。最后,利用STRAIGHT算法实现歌声的合成,并加入音乐伴奏。对转换的歌声进行了主、客观评测,结果表明,转换的歌声音质较好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号