首页> 中文学位 >基于FPGA实时语音识别系统的实现
【6h】

基于FPGA实时语音识别系统的实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景

1.2 国内外研究进展

1.3 课题研究目的及意义

1.4 主要研究内容

第2章 语音识别的主要算法

2.1 语音识别算法简介

2.1.1 MFCC(Mel Frequency Cepstrum Coefficient)算法

2.1.2 向量量化(Vector Quantification,VQ)

2.1.3 矢量量化

2.1.4 隐马尔科夫模型(HMM)

2.1.5 Baum-Welch重估算法

2.1.6 维特比(Viterbi)解码

第3章 基于HTK语音识别系统的实验

3.1 HTK软件体系结构

3.2 基于HTK调用Matlab语音识别的实验

3.2.1 建立语音库

3.2.2 语音特征的提取

3.2.3 声学模型的训练

3.2.4 识别结果分析

3.3 基于VC调用HTK语音识别系统

3.4 本章小结

第4章 语音识别系统架构及硬件设计

4.1 语音识别系统的架构

4.2 硬件实现

4.3 软件实现

4.3.1 SOPC系统的定制

4.3.2 NIOS-Ⅱ语音识别系统

4.3.3 NIOS-Ⅱ语音识别系统C语言算法的实现

4.4 语音识别系统编译

4.5 语音识别系统在线调试

4.6 本章小结

第5章 语音识别实验结果与分析

5.1 FPGA开发板简介

5.2 基于FPGA实现及识别结果

5.3 语音识别系统的执行时间分析

5.4 本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

语音是人类交流与沟通的最主要方式之一。随着语音技术的进步,手机、掌上电脑等逐渐被人们所熟知,无线通信及网络的普及,语音产品担任新一代智慧型产品与人类之间沟通的主要界面。语音识别产品对实时性和集成度要求较高,采用数字集成电路设计及其嵌入式系统的设计方法,实现嵌入式实时语音识别系统具有重要研究意义。
   本文首先介绍语音识别原理的主要算法,包括MFCC算法、向量量化算法、矢量量化算法、前向-后向算法和维特比算法。
   利用HTK调用Matlab建立0-9之间十个数字隐马尔科夫模型(HMM)的语音识别系统,设定梅尔频率倒谱系数(MFCC)的参数为13维,对语音进行特定人和非特定人训练和识别,特定人识别率为85.33%,非特定人识别率是75.12%。
   利用VC调用HTK建立界面化的语音识别系统,完成特征参数提取和识别结果显示,将训练语料库下载到现场可编程门阵列(FPGA)的SD卡中,作为实时语音识别系统的比对库。
   本系统设计采用定制的SOPC系统,将C语言模块集成到NIOS-Ⅱ系统中,设置自行定义的IP核和多个并行输入输出(PIO)接口,实现硬件模块与嵌入式系统的互连,充分发挥SOPC系统在数字信号处理中并行运算优势。
   采用FPGA的SOPC技术建立嵌入式实时语音识别系统,将整个系统集成到单一芯片上,芯片选择DE2-70EP2C70F896C6,完成实时语音输入到语音识别结果实时显示。
   实验结果表明,语音识别系统识别结果与软件识别结果完全一致,语音识别系统在FPGA上执行时间比软件仿真时间快近26倍,满足语音识别系统的实时性要求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号