首页> 中文学位 >基于对话型语音的说话人在线识别技术研究
【6h】

基于对话型语音的说话人在线识别技术研究

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1 说话人识别技术概述

1.1.1 说话人识别技术的发展

1.1.2说话人识别技术的分类

1.1.3说话人识别技术的应用

1.2说话人识别技术的研究现状

1.3本文的工作概述

1.3.1 本文的研究目的

1.3.2本文的主要工作

1.4本文的组织结构

第2章对话型语音的说话人识别系统平台

2.1 系统结构

2.2语音信号的预处理

2.2.1 预加重

2.2.2加窗及分帧

2.2.3端点检测

2.3特征提取

2.3.1 线性预测倒谱系数的基本原理

2.3.2 Mel频域倒谱系数的基本原理

2.4模式识别模型

2.4.1 矢量量化方法概述

2.4.2子空间方法概述

2.5本章小结

第3章基于矢量量化的说话人识别系统

3.1 系统流程

3.2预处理阶段

3.2.1加窗及分帧的实现

3.2.2端点检测的实现

3.3特征提取阶段

3.3.1倒谱分析

3.3.2线性预测倒谱系数LPCC

3.3.3 Mel频域倒谱系数MFCC

3.4矢量量化

3.4.1基本原理

3.4.2失真测度

3.4.3 LBG算法及其改进

3.5本章小结

第4章基于差别子空间的说话人识别系统

4.1 系统流程

4.2两阶段BIC说话人分割

4.2.1 BIC方法介绍

4.2.2 BIC方法的应用

4.2.3两阶段BIC分割之疑似分割点检测

4.2.4两阶段BIC分割之疑似分割点确认

4.3差别子空间方法介绍

4.3.1子空间的概念

4.3.2差别子空间的概念

4.4差别子空间方法的应用

4.5本章小结

第5章综合实验

5.1 实验平台

5.2实验结果及分析

5.2.1 LPCC与MFCC性能比较

5.2.2说话人分割对比实验

5.2.3改进的LBG算法

5.2.4基于差别子空间的说话人识别分析

5.2.5不同训练集大小对系统性能的影响

5.3本章小结

结论

参考文献

致谢

展开▼

摘要

说话人识别是一种较为有效的生物认证技术,它通过对语音数据的分析判断出何人在什么时间发出了声音。这种技术具有十分广阔的应用前景,已有的应用系统多为简单的说话人确认系统。本文研究了对话型语音的说话人识别技术,并实现了一个实用的说话人辨认系统。主要工作归纳如下:
   (1)提出了两阶段贝叶斯信息准则BIC(Bayesian Information Criterion)分割方法,第一阶段采用较大窗长分割策略保证了在线识别方法的即时性,第二阶段基于BIC的分割准则保证了说话人分割的准确性。
   (2)实现了一个基于矢量量化VQ(Vector Quantization)的说话人识别系统,改进了传统的LBG算法,使其更好的满足系统的在线识别特性。
   (3)提出了基于差别子空间的说话人识别方法,为每个说话人建立相应的子空间,将测试语音的个性特征与训练库中子空间进行比较,比较得分最高的即为识别结果。该方法有效提高了系统识别的准确率,同时降低了系统的时间开销,适合在线识别系统采用。
   (4)实现了一个基于对话型语音的说话人在线识别系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号