首页> 中文学位 >基于残差网络的声纹识别系统应用技术研究
【6h】

基于残差网络的声纹识别系统应用技术研究

代理获取

目录

声明

第1 章 绪论

1.1 概述

1.2 国内外研究现状

1.2.1 声纹识别算法的研究现状

1.2.2 神经网络的研究现状

1.3 论文研究内容及组织结构安排

第2 章语音信号特征提取与分类

2.1 声纹识别技术的流程

2.2 数据采集

2.3 预处理

2.4 特征提取

2.4.1 倒谱

2.4.2 梅尔倒谱系数MFCC

2.4.3 线性预测系数LPCC

2.4.4 Fbank特征

2.5 训练模型与识别

2.5.1 残差网络原理

2.5.2 三联体损失

2.5.3 训练模型与识别

2.5.4 判决阈值自适应方法

2.6 本章小结

第3 章系统总体方案

3.1 需求分析

3.2 方案设计

3.2.1 系统结构设计

3.2.2 硬件选型

3.2.3 软件环境搭建

3.3 本章小结

第4 章 基于残差网络的声纹识别系统的实现

4.1 基于残差网络的声纹识别算法软件实现

4.1.1 预处理软件实现

4.1.2 特征提取软件实现

4.1.3 模型训练与声纹识别软件实现

4.2 PC端系统软件的实现

4.2.1 人机交互界面的实现

4.2.2 TCP连接的实现

4.3 ARM端下位机软件的实现

4.4 本章小结

第5 章测试与结果分析

5.1 算法性能测试

5.1.1 测试环境

5.1.2 网络结构对比实验

5.1.3 改进预处理流程前后对比实验

5.2 系统功能测试

5.2.1 PC端软件功能测试

5.2.2 ARM端软件功能测试

5.3 本章小结

总结与展望

总结

展望

致 谢

参考文献

展开▼

摘要

随着生物识别技术的发展和人们对生活品质追求的提高,声纹识别技术逐渐应用在生活的方方面面,例如人工智能中声纹识别的应用,另外,在新冠疫情全球蔓延的今天,声纹识别凭借非接触等优势成为了研究热点。人们对声纹识别算法的实时性、准确率和应用生态等因素的要求也越来越高。而基于残差网络的声纹识别算法实时性较好,识别准确率高,因此,对基于残差网络的声纹识别系统的研究具有重要意义。  论文的主要工作包括以下几个方面:  首先,深入研究了基于残差网络的声纹识别的技术和方法,包括数据采集、预处理、特征提取、训练模型与识别,针对带噪语音分类得分降低的问题,提出了一种判决阈值自适应方法,并从系统需求着手,设计了基于残差网络的声纹识别系统的软硬件方案,选取合适的硬件并搭建相应的软件环境。  其次,完成了基于残差网络的声纹识别系统的软硬件实现。软件主要包括三个部分:1)基于残差网络的声纹识别算法;2)PC端声纹识别系统软件;3)ARM端下位机软件。系统可以识别通过PC端或ARM端实时采集的语音文件,针对噪声对识别结果影响较大和端点检测算法效果欠佳两个问题,在预处理过程中增加了基于LMS的语音增强模块并采用双门限法实现了端点检测模块。搭建了系统硬件平台,在JZ2440上采集语音,将其发送至PC端进行声纹识别,并展示返回的识别结果。  最后,本文对基于残差网络的声纹识别系统做了算法性能测试和系统功能测试。测试结果表明:1)残差网络替换卷积核后,在不降低识别准确率的前提下,提高了训练速度;2)改进语音预处理流程和加入判决阈值自适应方法能提升基于残差网络的声纹识别算法识别准确率。本系统结合了LMS自适应滤波、语音能量谱、网络传输以及残差网络等技术,实现了各项功能,对基于残差网络的声纹识别的应用具有一定的参考价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号