基于非线性理论的汉语语音编码技术研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

语音的数字化分析和处理是语音信号数字传输和数字存储的重要过程。随着语音通信技术的发展，高音质、低带宽等优点一直是人们追求的目标，语音压缩编码在实现这一目标的过程中担当着十分重要的角色。
　　目前语音信号的分析与压缩编码都是采用线性理论和线性预测编码技术，而语音信号的产生系统是一个复杂的非线性时变系统，具有混沌性和分形特征，所以采用线性方法来对语音进行处理无法从根本上提高语音传输和存储的性能。因此，论文在深入研究了语音信号非线性特性的基础上，结合径向基神经网络（简称RBF神经网络，Radical Basis Function Network）构造了一个语音信号非线性预测模型，并基于该模型设计出一个非线性预测编码系统。论文主要研究工作和创新点如下:
　　(1)语音信号的混沌性检测和分形特征
　　在非线性理论的基础上，针对汉语语音音素非线性特征参数的求解算法进行了研究，提出采用Wolf算法计算出33个汉语语音音素的最大Lyapunov指数，所得结果证明了汉语语音信号具有混沌性。然后采用GP算法求解出33个汉语语音音素的关联维数，根据所得结果说明浊音信号的产生系统是低维系统，而部分清音的发音系统是高维系统。
　　(2)语音信号的相空间重构及其参数确定
　　对语音信号非线性预测的理论依据以及预测工具进行了分析，并研究相空间重构参数——延迟时间和嵌入维数的确定方法。针对C-C算法存在的局限性，采用结合自相关算法、虚假近邻法的方法分别求解出汉语语音音素的延迟时间和嵌入维数。针对实验中采样率的选择和语音源的问题，论文运用统计分析的方法进行了研究，所得结果表明计算出的延迟时间和嵌入维数对不同的采样率和语音源具有较强的鲁棒性。
　　(3)基于RBF神经网络的汉语语音非线性预测模型
　　将汉语语音音素的非线性特征参数与RBF神经网络分析方法相结合，提出根据所计算出的33个汉语语音音素的延迟时间及嵌入维数作为RBF神经网络模型中三层网络神经元个数，构造出一个基于RBF神经网络的汉语语音信号非线性预测模型，并将该预测模型与现有的ADPCM线性预测模型进行了性能比较，仿真结果表明非线性预测模型预测误差较小，说明所提出的非线性预测模型具有更好的预测性能。
　　(4)基于小波变换的语音增强处理
　　针对语音信号的预测编码性能在噪声环境下会迅速下降的问题，研究了基于小波变换的语音增强处理技术，着重对小波去噪算法中的阈值去噪法进行了研究。一方面，针对阈值去噪算法中的传统阈值的选取难以适应非平稳噪声的这一缺点，将MCRA算法应用于小波域计算其噪声方差，得到随实时变化的噪声估计，并利用谱平坦度自适应调整阈值;另一方面，针对传统的软硬阈值函数的不足，在Breiman提出的非负死区阈值函数的基础上进行了改进，设计出一种改进的阈值函数，并从连续性、单调性等方面进行分析，验证其合理性。
　　(5)语音E-CENP编码系统的设计
　　运用构造出的非线性预测模型，结合增强处理和CELP语音编码算法，设计了一个非线性预测编码系统——E-CENP。系统中，预处理部分加入了所提出的小波变换的语音增强处理，预测器部分采用了所设计的RBF神经网络的非线性预测模型。仿真结果表明:与CELP线性预测编码系统相比，该非线性预测编码系统具有编码语音质量高、鲁棒性好等优点。
　　论文运用非线性的理论和方法，构造了一个E-CENP语音编码系统，与CELP编码系统相比，该编码系统编解码后恢复出的语音信号的音质比较高而且鲁棒性较好，说明所提出的非线性理论的研究方法适合于具有非线性特性的语音，为语音信号的处理技术提供了新的思路和新的方法。

著录项

作者
覃爱娜;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科控制理论与控制工程
授予学位博士
导师姓名桂卫华;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;人工神经网络与计算;
关键词
汉语语音信号; RBF神经网络; 非线性预测编码; 混沌性; 分形特征;

相似文献

中文文献
外文文献
专利

1. 基于微格矢量化编码与缺陷跟踪的汉语语音数据采集研究 [J] . 陈展 . 价值工程 . 2016,第002期
2. 基于混沌纠错交织编码的语音隐藏技术研究 [J] . 席青云 . 赤峰学院学报（自然科学版） . 2020,第006期
3. 基于预测编码的语音压缩技术研究 [J] . 曾冬梅 . 无线互联科技 . 2019,第014期
4. 基于生成对抗网络的汉语语音增强技术研究 [J] . 向前 ,唐勇 . 计算机应用研究 . 2020,第S02期
5. 基于受限汉语自然语言的语音识别与生成指令驱动技术研究与实现 [J] . 陈玲 ,李少伟 ,钱勇 . 科技创新导报 . 2010,第012期
6. 宽带语音编码及低速率语音编码关键技术及发展方向 [C] . 汤一彬 ,王仕奎 ,吴镇扬 . 2008年全国博士生学术会议——暨新一代信息技术的发展趋势、核心技术与应用前景研讨会 . 2008
7. 基于非线性理论的汉语语音的分析及预测 [A] . 高晓红 . 2012

基于非线性理论的汉语语音编码技术研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅