首页> 中文学位 >可区分性原则在语音分离中的应用
【6h】

可区分性原则在语音分离中的应用

代理获取

目录

文摘

英文文摘

第一章语音分离技术的需求和现状

一概述

二语音分离的现实需求

三语音分离技术的现状

第二章可区分性原则和语音信号分离

一可区分性原则与盲信号分离

二语音信号特征

三投影空间

四聚类技术

五优化技术

六先验知识

第三章双声道语音分离技术

第四章小结

参考文献

附录研究生期间发表的计算机专业相关论文

附:学位论文原创性声明和关于学位论文使用授权的声明

展开▼

摘要

语音技术是现代计算机技术中非常重要的技术。人与人之间进行交流的最自然方式是语言。而现代计算机的使用是通过鼠标和键盘输入,通过显示器、打印机等设备来得到计算机输出的结果。这对人来说当然不是最自然的交流方式。从这个意义上来说,现代计算机并不是最终的和最好的产品;而只是人类以自己对环境的适应能力来屈就的产物。因此,一直以来,计算机科学家们都在寻找能够使计算机能够与人通过自然语言交流的技术。  但是直到现在,语音技术还没有全面进入实用化、商用化。主要是因为现代语音技术还有两个关键的问题没有完全解决。其一是噪声环境下的语音增强和分离技术;其二是完善的自然语言理解。  不能解决语音技术的这两个非常关键的前、后端技术,语音技术就不可能进入大规模应用,只能是研究人员手中的玩具。  噪声环境下的语音识别技术一直都是语音识别系统的重点和难点。但是在很长的时间中,由于相应的数学方法和技术手段一直没有得到发展,所以进步很慢。  随着上世纪九十年代中期,高阶统计学和分数低阶统计学应用的逐渐推广,出现了从PCA(主成分分析)技术中发展出来的ICA技术,从FA(因子分析)技术中发展出来的IFA技术。这两种技术不需要知道信号的先验知识,就可以几乎很完美地分离出每一个信号。虽然这两种技术都存在一定缺陷,由于技术本身显示出来的能力,导致现代信号分离技术(特别是盲信号分离技术的)的迅速发展。现在,盲信号分离技术在其他方向也取得了一定进步,并因此带动了语音分离技术的进步。  通过对大量文献的阅读、研究、抽象和总结,本文提出以下的可区分性原则:  原始混合信号可投影于这样的投影空间,在该投影空间中同一信号由于某些特征而在投影空间中密集分布,而信号之间由于这些特征的区别在投影空间中完全分离或者稀疏过渡;或者不同信号虽然聚集在一起,但是投影空间足够稀疏而可以相互区分。  并在该原则指导下,提出了以下信号分离的广义框架:  1将信号投影到某一特征投影空间;  2在该投影空间中对信号的参数按照一定规则聚类;  3从投影空间将聚类后的信号向信号空间进行逆映射,重构信号。  以上的广义框架就是信号分解技术的关键步骤。对于不同的算法,虽然进行分离的途径之间极其不同,但是都要经过以上的“投影—聚类—重构”过程。  基于以上的可区分原则和由此推出的信号分离的广义框架,本文分析了各种可能的可以进行信号分离的投影空间,并对在这些空间进行聚类的技术进行了分析。  在此基础上,本文将两种相应信号分离技术用到双声道语音分离技术。因为双声道语音分离往往需要分离出远多于声道数的源信号。这时问题是超定的,需要用到信号信号的稀疏性。本文的两种信号分离方法都用到了不同的信号稀疏性特性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号