首页> 中文学位 >基于Android的声纹身份验证系统的研究与实现
【6h】

基于Android的声纹身份验证系统的研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景和意义

1.2 声纹识别技术的发展与现状

1.3 声纹识别技术

1.4 研究目标和主要内容

1.5 本文的组织结构

第二章 语音特征参数的提取

2.1 语音信号分析概述

2.2 语音信号的数字化

2.3 语音信号的预处理

2.4 MFCC特征参数提取

2.5 改进的MFCC参数

2.6 小结

第三章 基于自适应GMM的说话人确认

3.1 概述

3.2 高斯混合模型的表示

3.3 UBM模型

3.4 说话者模型的自适应

3.5 有关提高判决阶段计算效率的研究

3.6 小结

第四章 基于Android的声纹身份认证系统的实现

4.1 Android系统概述

4.2 Android开发平台搭建

4.3 系统功能设计

4.4 系统主要模块的实现

4.5 小结

第五章 实验测试与结果分析

5.1 实验环境

5.2 实验结果及讨论

5.3 小结

第六章 总结与展望

参考文献

致谢

在读期间发表的论文

展开▼

摘要

古人云:“未见其人,先闻其声”。这句话的含义是人们可以根据一个人的声音来辨别这个人的身份。因此,这里的声音可以被认为是一个人特有的生物特征,我们称之为“声纹”。声纹识别又叫说话人识别,它是通过对说话人的语音进行分析,然后对说话人的身份进行识别或判断的技术。在司法鉴定、安全认证、智能家居等领域,声纹识别技术得到了广泛的应用,也因此受到了国内外语音信号处理研究者们的很大关注。
  近年来,随着智能移动终端的普及和移动互联网的迅速发展,基于移动平台的声纹识别应用将会有更广阔的发展空间。同时,由Google带领开发的Android操作系统因其出色的系统性能、简便的开发方法和良好的可移植性等原因,成为市场占有率最高的移动智能操作系统。因此,本文对声纹识别技术中的一个重要方向——说话人确认方面的相关技术以及其在Android系统上的实现进行了深入研究。
  一个基本的声纹身份确认系统主要由说话者声音特征提取模块、说话者语音模型训练模块以及对待测语音测试判决模块组成。语音特征的提取模块主要是解决如何从语音信号中提取出可以代表说话者声音特征的语音特征参数。语音模型的训练模块主要是使用说话者特征向量和特定的模型训练出最能代表说话者声音特性的模型参数。而对测试语音的测试和判决模块就是把带测试语音信号与所声明说话者的模型进行对比评分,从而判定该测试语音是否是由所声明的说话人发出的。本文在对以上三个主要方面的技术进行了了解和分析的基础上,重点研究以下三个方面内容:
  1.语音特征提取技术:本文对目前采用比较广泛的梅尔倒谱系数(MFCC)参数的提取进行了研究。对其存在的缺点以及不足进行了总结,然后对传统的MFCC参数进行了改进。改进后的MFCC参数主要在传统MFCC参数的基础上增加了一阶、二阶动态MFCC参数,同时将MFCC参数的高阶系数进行了余弦提升,得到一个改进的MFCC特征参数组合。
  2.语者建模和测试判决方法:本文的建模和测试方法基于高斯混合模型(GMM)的通用背景模型(UBM)以及最大化后验概率(MAP),并且重点针对移动平台应用的特性,对如何提高测试判决阶段的计算效率进行了研究。本文主要研究了两种提高计算效率的方法:一种是直观地减少测试语音时长;另一种是本文提出的根据阈值对高斯份量进行选择再做评分计算的快速评分方法。
  3.基于Android系统的原型实现:主要研究如何在Android平台将声纹确认系统实现。本文对系统的功能、用户界面、数据库等必要组成部分进行了设计。在复杂功能的实现上,将语音特征提取、说话者建模等功能封装在动态链接库中,供上层应用以JNI的方式调用。
  最后,对上面提到的改进内容进行了实验研究并对结果进行了分析。实验结果表明,在语音特征提取方面,改进后的MFCC参数可有效提高系统对噪声的鲁棒性;在计算效率方面,本文对测试语音的时长以及基于阈值选择的快速评分方法中的参数都进行了实验分析,最后得到的系统不仅在计算速度方面较快,同时也有着较好的识别准确率,具备了一定的可用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号