基于深度学习的开放场景下声纹识别系统的设计与实现

郭新; 罗程方; 邓爱文

首页> 中文期刊>南京信息工程大学学报 >基于深度学习的开放场景下声纹识别系统的设计与实现

基于深度学习的开放场景下声纹识别系统的设计与实现

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.

著录项

来源
《南京信息工程大学学报》|2021年第5期|526-532|共7页
作者
郭新; 罗程方; 邓爱文;
展开▼
作者单位

广东交通职业技术学院机电工程学院广州 510520;

华南理工大学自动化科学与工程学院广州 510641;

华南理工大学自动化科学与工程学院广州 510641;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音信号处理;人工智能理论;
关键词
深度学习; 开放场景; 短时语音; 声纹识别; 差分化编码; NeXtVLAD; 树莓派;

相似文献

中文文献
外文文献
专利

1. 生产环境下声纹识别系统的设计与实现 [J] . 张舒 ,王成强 ,李想 . 南京师范大学学报（工程技术版） . 2018,第004期
2. 基于深度学习的场景识别系统 [J] . 张正阳 . 电子制作 . 2019,第002期
3. 基于深度学习的鱼类智能识别系统的设计与实现 [J] . 吕俊霖 ,麦嘉铭 ,熊浩 . 渔业现代化 . 2021,第003期
4. 基于深度学习的身份证识别系统的设计与实现 [J] . 戈嘉宇 ,刘为嵩 . 电子世界 . 2020,第002期
5. 基于深度学习的银行卡号识别系统设计与实现 [J] . 胡潇晗 ,杨立 . 信息技术与信息化 . 2020,第001期
6. 电话语音中基于多说话人的声纹识别系统 [C] . 郑燕琳 ,杨晓炯 ,许星宇 . 第三届全国计算机取证技术研讨会 . 2010
7. 基于深度学习的场景识别系统的设计与实现 [A] . 李瑞阳 . 2020

基于深度学习的开放场景下声纹识别系统的设计与实现

摘要

著录项

相似文献

相关主题

期刊订阅