首页> 中文学位 >多音频信号分离与识别技术的研究
【6h】

多音频信号分离与识别技术的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究的背景和意义

1.2 多音频信号分离技术的国内外研究现状

1.3 基于稀疏表示识别音频信号的研究现状

1.4 多音频分离与识别技术的难点问题

1.5 论文的主要内容及结构安排

第2章 听觉系统模型

2.1 引言

2.2 双耳时间差与双耳水平差

2.3 听觉系统模型

2.4 本章小结

第3章 基于听觉系统模型的多音频信号分离

3.1 引言

3.2 多频率声音片段的归属划分

3.3 基于听觉模型反演技术重构声音片段

3.4听觉模型半波整流逆变换的音频恢复

3.5 实验验证

3.6 本章小结

第4章 多音频信号的识别

4.1 引言

4.2 音频信号的MFCC特征获取

4.3 音频信号的稀疏特征的获取

4.4 基于支持向量机识别音频信号

4.5 基于稀疏特征加权技术的音频信号识别

4.6 实验验证

4.7 本章小结

第5章 多音频信号分离与识别演示系统

5.1 系统总体设计

5.2 多音频信号分离与识别演示系统

5.3 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

在现实环境中,音频信号总是不可避免地会受到环境噪声以及其他声源信号的干扰,这给声音信号的处理带来诸多挑战,另外如何在大量的音频信息中迅速找到并识别出感兴趣的声音信息也是一个难点问题,同时更是近些年来声音信号处理领域的研究热点之一,因此多音频信号分离与识别系统的建立,对于工业应用、国防军事等很多相关领域都有极其重要的理论研究与应用的价值。
  在已有的听觉生理学的科研成果基础上,建立了一个听觉模型。该模型主要包括可以提升声音数据中、高频特性的外耳、中耳模型,可以对音频信号进行多频道滤波处理的基底膜模型以及能够获得特征信息的内毛细胞-听神经模型。
  利用双耳时间差、双耳水平差、听觉神经发放概率以及自相关图谱等特征参数,实现多音频信号的分离。系统阐述了将多频率声音信号的混合数据通过Gamma tone滤波器实现多频率通道的分离,求出每一个频率通道的信号的声源位置方位角,根据方位角的差异将频率通道划分为几个大的归属类别,由每个频率通道的自相关图谱等特征参数利用幅度谱特征迭代算法来实现信号波形的重构,并且根据半波整流逆变换技术恢复前面丢失的负信号部分,以此来实现各个频率通道声音信号波形的恢复,把同属一个类别的多个频率通道的波形图进行迭接相加,获得了音频信号的完整波形图,其他归属类别的波形图恢复过程相同。最终实现音频信号的分离。
  接着再对分离出来的各个音频信号进行识别。本文在提取信号特征参数过程中主要获得了两个典型的特征:梅尔倒谱系数特征(MFCC)以及稀疏特征,然后利用支持向量机分别对这两个特征进行训练、识别。同时对信号的稀疏特征运用了特征加权技术,使此特征能够更加完全地表征目标信号,有效地提升了识别的准确性,并最终实现了利用SVM分类器识别音频信号的目标。
  之后根据整个系统模型的原理,利用Matlab GUI仿真软件实现了多音频信号分离与识别系统的建立。
  最后是总结与展望部分。从整体上阐述分离与识别系统的原理性内容及其优缺点,以及所完成的工作,最后叙述未来需要继续完成的任务。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号