基于HMM的歌词到歌声转换的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音合成技术在人机交互领域是一个重要研究内容，有着广泛的应用，歌声合成是语音合成的研究热点。本研究利用了文语转换（Text-To-Speech,TTS）技术，通过HTS(HMM-based Speech Synthesis System)实现歌声的合成。利用训练语料建立说话人相关的声学模型。通过MIDI（Musical Instrument Digital Interface）乐谱，获得歌声的音乐信息。通过分析对比说话语音和歌声信号在声学特征方面的差异，建立歌声的旋律控制模型。对输入的歌词文本进行文本分析，获得上下文相关的标注，并利用训练得到的说话人相关模型，获得说话人相关的声学参数。通过旋律控制模型对声学参数进行修改。最后，利用STRAIGHT（Speech Transformation and Representation based on Adaptive Interpolation of weiGHTed spectrogram）算法实现了基于HMM（Hidden Markov Model，HMM）的歌词到歌声的转换。论文的主要工作与创新如下：
　　1.建立了面向歌曲合成的基于HMM的说话人相关的声学模型。利用多说话人的语音语料，分析语音，得到基频（F0）、时长、频谱（SP）以及非周期索引（AP）等声学参数，并利用说话人自适应训练技术，训练获得平均音模型。在此基础上，利用目标说话人的语音，通过说话人自适应变换技术，得到目标说话人的声学模型。
　　2.建立了旋律控制模型。从MIDI文件提取乐谱信息，分析乐谱文件结构，获得通道标号、音符音高、键的速度、音符起始时间、音符持续时间等音乐信息。分析语音和歌声在声学特征的差异，建立了歌声的旋律控制模型，包括基频控制模型和时长控制模型。利用基频控制模型将乐谱中的离散音高转换为连续的基频曲线，并利用时长控制模型获得歌唱音符的发音时长。
　　3.实现了歌词到歌曲的转换。对输入的歌词文本进行文本分析，获得上下文相关的标注，并利用说话人相关的模型，生成频谱、非周期索引2个声学参数。同时根据MIDI文件，获得歌词中每个音符的音高和音长，并通过旋律控制模型获得相应的基频和时长，并根据音符时长获得音节的频谱、非周期索引和基频的时长。最后，利用STRAIGHT算法实现歌声的合成，并加入音乐伴奏。对转换的歌声进行了主、客观评测，结果表明，转换的歌声音质较好。

著录项

作者
冯欢;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科电子与通信工程
授予学位硕士
导师姓名杨鸿武;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音合成;
关键词
歌声合成; 旋律控制模型; 文语转换; STRAIGHT算法;

相似文献

中文文献
外文文献
专利

1. 基于中国流行音乐歌词的语码转换修辞效果研究 [J] . 张文颐 . 蚌埠学院学报 . 2013,第004期
2. 基于HMM的中国股市状态转换及预测 [J] . 胡淑兰 ,魏捷 ,黄晟 . 统计与决策 . 2011,第22期
3. 基于HMM的混合激励英语文语转换系统 [J] . 雷冠军 . 江南大学学报（自然科学版） . 2010,第006期
4. 基于HMM的英语文语转换系统 [J] . 冯志红 ,张连海 ,吴保民 . 信息工程大学学报 . 2008,第001期
5. 基于音素HMM模型语音转换 [J] . 钱开华 . 电脑知识与技术：学术交流 . 2008,第004期
6. 基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究 [C] . 秦龙 ,吴义坚 ,王仁华 . 第八届全国人机语音通讯学术会议（NCMMSC8) . 2005
7. 基于词典与HMM相结合的蒙古文最小词素编码到标准编码的转换研究 [A] . 许杨 . 2018

基于HMM的歌词到歌声转换的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅