首页> 中文学位 >基于振荡神经网络的语音分离算法的研究
【6h】

基于振荡神经网络的语音分离算法的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

Contents

1 绪论

1.1 语音分离概述

1.2 传统的语音分离的方法

1.3 当前的语音分离算法中所存在的问题

1.4 语音分离的应用

1.5 本文的研究重点和所做工作

2 振荡相关神经网络模型分析

2.1 振荡模型的提出

2.2 局部激励及全局抑制

2.3 LEGION模型的工作原理

2.4 横向势能的引入

3 基于LEGION的语音分离算法

3.1 引言

3.2 模型概述

3.3 外围听觉系统模型

3.4 中级听觉系统的描述

3.5 双层振荡神经网络

3.7 本章小结

4 评估系统

4.1 用SNR作为评估指标

4.2 能量恢复的评估指标

5 结束语

5.1 工作总结

5.2 展望

致谢

参考文献

展开▼

摘要

语音分离是实现机器听觉的一个重要而基础性的任务,人们总是希望在一个有多个声音源及各种环境噪声的混合语音中提取出自己感兴趣的声音,这对于我们人类的听觉系统来说是件容易的事,就如“鸡尾酒会效应”里所提到的,人们可以在嘈杂的鸡尾酒会上很准确的捕捉到自己感兴趣的声音。但这对于计算机来讲是十分困难的。对于这个问题的研究很多学者提出了许多的方法。目前对于语音分离主要有盲源分离和基于场景分析两类方法。对于听觉场景分析的研究有两种方法:听觉场景分析,计算听觉场景分析。但是目前的语音分离算法还很难有效地模拟人耳的听觉系统。
  本文是结合振荡神经网络模型来实现混合语音分离,这个模型的核心是一个两层的振荡神经网络,在这个两层的神经网络中,在振荡相关的基础上实现流分离。在这个振荡相关的结构里,第一层是分段层,将语音信号分成一系列的听觉元素,第二层是组合层,将源自于同一声音源的听觉元素组合起来,是以形成两个同步的振荡块的形式来表现的。在振荡神经网络之前语音信号要经过外围听觉模型以及中级听觉系统,来模拟人耳的频率选择特性,并且提取相关信息。最后一个再合成阶段,是用组合层中形成的两个流对gammatone滤波器的输出进行重新组合,得到分离后的声音流。另外本文还讨论了很多关于生物可信性和实时执行性的一些问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号