首页> 中文学位 >基于MFCC字典和SL0算法的语音压缩感知研究
【6h】

基于MFCC字典和SL0算法的语音压缩感知研究

代理获取

目录

声明

专用术语注释表

第一章 绪论

1.1课题研究的背景及意义

1.2压缩感知理论国内外的研究现状

1.3压缩感知理论在语音信号处理中的研究现状

1.4论文主要研究内容和后续章节安排

第二章 压缩感知理论及语音压缩感知

2.1压缩感知与传统奈奎斯特采样的区别及联系

2.2压缩感知理论框架

2.3基于压缩感知的语音信号处理

2.4本章小结

第三章 基于过完备MFCC字典的语音压缩感知

3.1引言

3.2基于K-SVD算法训练过完备字典

3.3基于MFCC参数字典的语音压缩感知

3.4本章小结

第四章 基于SL0算法的语音压缩重构模型

4.1引言

4.2语音压缩感知重构算法

4.3基于平滑L0算法的语音压缩重构模型

4.4实验结果及分析

4.5本章小结

第五章 总结与展望

5.1工作总结

5.2进一步研究方向展望

参考文献

附录1 攻读硕士学位期间撰写的论文

附录2 攻读硕士学位期间申请的专利

附录3 攻读硕士学位期间参加的科研项目

致谢

展开▼

摘要

压缩感知理论框架下,采样率低于传统奈奎斯特采样定理,实现了压缩和采样的同步进行,同时用较少的观测值实现信号高质量重构。语音信号在频域和离散余弦变换域等都具有良好的稀疏特性,满足压缩感知的先验条件,因此可以基于压缩感知对语音信号进行处理。将压缩感知应用于语音信号处理,这对信号的采样、存储、传输等都带来了很大方便。将压缩感知理论用到语音信号中来探求语音处理的新方法具有很好的理论意义和实际价值。
  本文的研究目标是设计并优化语音压缩感知的稀疏分解基和重构算法,使得语音信号获得更高的重构质量、减少重构时间,奠定语音压缩感知在实际应用中的理论基础。论文主要对语音压缩感知中稀疏表示和重构算法部分进行了研究:提出了基于语音MFCC参数的过完备字典,提出了一种基于平滑L0算法的语音压缩重构模型,丰富了语音压缩感知理论。本文主要研究内容和创新成果包括:
  (1)介绍了压缩感知与传统奈奎斯特采样的区别与联系,分析了压缩感知的理论框架。详述了语音处理中的压缩感知应用,包括语音压缩感知中常用稀疏基、观测矩阵和重构算法。并实验验证了语音信号在DCT基、过完备DCT字典、K-SVD字典下的稀疏性,对比了语音信号基于不同稀疏基、观测矩阵和重构算法时的重构效果。实验结果表明,语音压缩感知中稀疏基、观测矩阵和重构算法的选取、以及语音帧长、压缩比对语音信号重构都会产生影响。
  (2)提出了基于语音MFCC参数的过完备字典构造方法。介绍了语音信号MFCC参数的提取过程,以及基于过完备MFCC字典的语音压缩感知的实现过程。实验证明了语音信号在过完备MFCC字典上具有稀疏性;在相同的训练语音数目和字典规模的情况下,相比于传统的K-SVD字典,过完备MFCC字典训练时间大大减少,使得字典训练更容易实现。这种优势在语料比较多的情况下更为明显。过完备MFCC字典应用于语音压缩感知中是可行的并具有重要意义。
  (3)提出了一种基于平滑 L0算法的语音压缩重构模型。平滑 L0算法是用平滑函数逼近L0范数,它不需要提前知道信号的稀疏度,具有计算量低、重构质量高等优点。此外,提出了一种新的平滑函数,并基于高斯函数和新的平滑函数来验证平滑L0算法在语音压缩重构中的优越性。实验结果证明,基于两种平滑函数的SL0算法,对语音信号进行重构时,性能均优于传统常用的OMP算法、BP算法等。并且,在压缩比高于0.4时,基于新的平滑函数的SL0重构模型的语音重构质量要高于使用标准高斯函数的SL0重构模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号