首页> 中文学位 >基于UBM和PLDA的异常声识别方法研究
【6h】

基于UBM和PLDA的异常声识别方法研究

代理获取

目录

第一个书签之前

展开▼

摘要

异常声音通常是指在安静的环境下突然出现的非语音声,例如,玻璃破碎声音、婴儿哭声、爆炸声、敲门声等,它在智能监控、场景辨识、安全监测等场合具有广泛应用。目前,异常声音监测与识别技术的研究已取得一定的进展,并在实际中得到应用,但识别率相对较低,鲁棒性能较差,不能满足实际需要。本文对异常声音监测与识别技术进行了研究,通过应用统一背景模型和PLDA模型,提高了识别性能。 本文的主要工作如下: (1)研究了异常声音特征提取方式、语音活动检测中自适应阈值的选择以及传统异常声音识别的分类模型。 (2)详细研究了高斯混合统一背景模型的识别系统,推导了统一背景模型训练参数的流程和最大自适应准则的匹配过程。设计了仿真实验,研究了统一背景模型中高斯模型的分量数目和梅尔频率倒谱系数维度对实验性能的影响,对比了统一背景模型和高斯混合模型对异常声音分类效果的优劣。 (3)搭建了基于身份识别向量和PLDA模型的异常声音识别系统。对身份识别向量的提取算法流程和PLDA模型进行了详细介绍,通过估计总变异空间矩阵,利用空间矩阵和因子分析技术,对身份识别向量进行了降维处理,并基于PLDA模型进行评分。在仿真实验中,对比了不同维度的身份识别向量,研究了PLDA因子维度等参数对异常声识别效果的影响。

著录项

  • 作者

    马士乾;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 陈喆;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 道路工程;计算技术、计算机技术;
  • 关键词

    声识别;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号