首页> 中文学位 >基于音素的子带贡献提取言语特征的说话人识别研究
【6h】

基于音素的子带贡献提取言语特征的说话人识别研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1研究背景

1.2研究进展

1.3论文研究主要内容

1.4论文研究结构安排

第二章 说话人的个性特征分析

2.1语音产生机理

2.2说话人识别特征参数提取

第三章 数据采集与处理

3.1中文说话人识别标准语料库

3.2中文普通话MRI数据库

第四章 实验分析

4.1说话人识别实验

4.2 汉语中说话人信息在不同频带的分布特性

4.3基于F-ratio贡献率的非线性频率尺度变换

4.4说话人识别性能分析

第五章 鼻音及非鼻音的软腭耦合分析

5.1鼻腔介绍

5.2鼻腔形态学及声学的个性差异

5.3 鼻腔声学分析

5.4 非鼻音中的软腭耦合研究

第六章 总结与展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

本文首先运用统计方法F-ratio对汉语音素的子带贡献率的分布情况进行分析,提取有用的不同频带上的说话人信息进行说话人识别。然后针对中文的音素特性,与朝鲜语和日语进行比较,分析中文的说话人信息分布特点,结果表明鼻腔是说话人识别的重要特征。然后,从形态学和声学分析角度,对鼻腔的声学作用进行深入分析,分析结果表明与统计方法结论一致。最后,本文对鼻音,非鼻音化元音以及日语有声子音在发声状态下的软腭声学影响进行实验研究,研究表明,软腭存在两种作用,一是鼻音状态软腭是开闭状态,声音通过鼻咽通道传送;二是非鼻音状态下,通过软腭振动作用于鼻腔。
  说话人识别实验中,运用改进F-ratio方法,对每个说话者每句话进行音素划分,得到每个音素在子带中的得分,通过归一化处理,最终得到所有说话人在不同子带的说话人信息分布。实验结果表明说话人信息在不同频带呈现非均匀分布特点。基于贡献率分布情况提取特征参数,运用GMM模型进行建模,与MFCC特征参数相比,中文识别率为94.3%,错误率降低了32.9%。
  接下来,本文对鼻腔进行形态学和声学分析。运用中文普通话MRI数据库提取了四位说话人的鼻腔,通过对比鼻腔的形状和鼻腔面积函数,发现不同说话人之间的鼻腔形态结构差异很大。然后分析了鼻腔的声学效应,实验表明在2kHz到4kHz之间,不同说话人鼻音的共振峰差异也很大。上述结论与统计法的研究结论一致。
  最后,本文研究了鼻音化元音及有声子音发音状态下的软腭声学作用。测量实验表明,鼻腔的声音辐射与声音呈线性相关,说明voice bar的声音辐射产生从鼻腔发出,受软腭振动所致。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号