首页> 中文学位 >汉语普通话易混淆音素的声学区分
【6h】

汉语普通话易混淆音素的声学区分

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景

1.2研究意义

1.3国内外研究现状

1.4主要研究内容

第二章汉语语言学及语音学知识

2.1发音的生理结构和过程

2.2声母的特征

2.2.1声母概述

2.2.2音位与区别特征

2.2.3声母的区别特征

2.3平舌音和卷舌音的特点

2.4语音信号的数字模型

2.5语音信号的数字化和预处理

2.5.1语音信号的数字化

2.5.2语音信号的预处理

第三章语音信号的特征参数

3.1短时平均能量

3.2倒谱分析

3.3 MFCC参数

3.4 PLP参数

第四章区分易混淆音素的新特征参数

4.1基于强频集中区的新特征参数

4.1.1强频集中区

4.1.2新特征参数的提取

4.2基于MFCC的新特征参数

4.2.1 Mel频率介绍

4.2.2新特征参数的提取

4.3基于小波包变换和PLP参数的新特征参数

4.3.1短时傅里叶变换

4.3.2小波分解

4.3.3小波包分解

4.3.4新特征参数的提取

第五章高斯混合模型理论

5.1 GMM模型的基本概念

5.2 GMM模型的参数估计

5.3 GMM模型的识别算法

第六章实验结果及实验分析

6.1实验系统框架

6.2实验用的语音数据

6.3实验系统及算法实现

6.3.1基于强频集中区的新特征参数实验结果

6.3.2基于MFCC的新特征参数实验结果

6.3.3基于PLP的新特征参数实验结果

6.4实验结果分析

6.4.1新特征参数对三组易混淆音素的结果分析

6.4.2易混淆音素采用三种新特征参数的结果分析

结束语

致谢

参考文献

研究成果

展开▼

摘要

随着世界经济一体化和我国在世界经济中地位的逐步提高,汉语普通话的学习成为国内外越来越多人士的迫切需求,由于学习人数的急剧增多,普通话教学资源显得越来越匮乏。计算机辅助教学,一方面可以节省大量的汉语教师资源,同时又能满足学生随时随地独立学习的要求,是解决上述问题的一种有效手段。 目前世界上主流的计算机辅助教学技术是采用语音识别的框架,这种框架的缺点就是声学模型对相似发音的鉴别能力有限,因此对易混淆音素的评估准确程度不高。为了弥补语音识别框架的这一缺点,本文对计算机辅助教学中汉语普通话易混淆音素的区分进行了研究,针对易混淆音素的声学特征,提出了三种新的特征参数,并采用高斯混合模型(GMM)分类方法,形成一个针对易混淆音素区分的识别算法。 在易混淆音素的区分框架中,针对发音方法相同发音部位不同的平舌音和卷舌音的区分,提出了采用强频集中区的能量分布作为区别特征的方法;针对平舌音和卷舌音的能量分布不同,通过美尔三角滤波器组提取高低频的能量累积和,提出了基于美尔倒谱系数(MFCC)特征的新参数作为区别特征的方法;针对入耳听觉感知模型,采用了小波包分解的方法,对易混淆音素的频谱特征进行了精细的描述,提出了基于感觉加权线性预测系数(PLP)特征的新参数作为区别特征的方法,使用GMM对新的特征参数进行分类,并且针对不同的模型阶数进行实验,从而达到区分的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号