基于音素的子带贡献提取言语特征的说话人识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文首先运用统计方法F-ratio对汉语音素的子带贡献率的分布情况进行分析,提取有用的不同频带上的说话人信息进行说话人识别。然后针对中文的音素特性,与朝鲜语和日语进行比较,分析中文的说话人信息分布特点,结果表明鼻腔是说话人识别的重要特征。然后,从形态学和声学分析角度,对鼻腔的声学作用进行深入分析,分析结果表明与统计方法结论一致。最后,本文对鼻音,非鼻音化元音以及日语有声子音在发声状态下的软腭声学影响进行实验研究,研究表明,软腭存在两种作用,一是鼻音状态软腭是开闭状态,声音通过鼻咽通道传送;二是非鼻音状态下,通过软腭振动作用于鼻腔。
　　说话人识别实验中,运用改进F-ratio方法,对每个说话者每句话进行音素划分,得到每个音素在子带中的得分,通过归一化处理,最终得到所有说话人在不同子带的说话人信息分布。实验结果表明说话人信息在不同频带呈现非均匀分布特点。基于贡献率分布情况提取特征参数,运用GMM模型进行建模,与MFCC特征参数相比,中文识别率为94.3％,错误率降低了32.9%。
　　接下来,本文对鼻腔进行形态学和声学分析。运用中文普通话MRI数据库提取了四位说话人的鼻腔,通过对比鼻腔的形状和鼻腔面积函数,发现不同说话人之间的鼻腔形态结构差异很大。然后分析了鼻腔的声学效应,实验表明在2kHz到4kHz之间,不同说话人鼻音的共振峰差异也很大。上述结论与统计法的研究结论一致。
　　最后,本文研究了鼻音化元音及有声子音发音状态下的软腭声学作用。测量实验表明,鼻腔的声音辐射与声音呈线性相关,说明voice bar的声音辐射产生从鼻腔发出,受软腭振动所致。

著录项

作者
赵辰;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科计算机技术
授予学位硕士
导师姓名张钢,孙提;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人; 言语识别; 特征提取; 音素特性; 子带贡献率;

相似文献

中文文献
外文文献
专利

1. 一种基于子带处理的PAC说话人识别方法研究 [J] . 陈迪 ,何静媛 ,李战明 . 计算机仿真 . 2008,第003期
2. 说话人识别中基于音素分类的数据选择方法 [J] . 吴蔚澜 ,张卫强 ,刘巍巍 . 中国科学院大学学报 . 2014,第005期
3. 说话人识别中基于音素分类的数据选择方法 [J] . 吴蔚澜 ,张卫强 ,刘巍巍 . 中国科学院研究生院学报 . 2014,第005期
4. 基于特征音素的说话人识别方法 [J] . 王昌龙 ,周福才 ,凌裕平 . 仪器仪表学报 . 2007,第10期
5. 基于修正Mel子带系数的文本无关的说话人识别 [J] . 张庆芳 ,赵鹤鸣 . 计算机工程与应用 . 2011,第001期
6. 一种基于子带提取二次特征的说话人识别方法 [C] . 尹晓霈 ,陈迪 ,李战明 . 2007年中国智能自动化会议 . 2007
7. 基于Mel子带系数的文本无关的说话人识别 [A] . 张庆芳 . 2006

基于音素的子带贡献提取言语特征的说话人识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅