首页> 中文学位 >基于BIC的通用音频分割方法研究
【6h】

基于BIC的通用音频分割方法研究

代理获取

目录

基于BIC的通用音频分割方法研究

RESAERCH ON BIC-BASED GENERAL AUDIO SEGMENTATION METHOD

摘要

Abstract

第1章 绪论

1.1 课题背景

1.2 音频分割技术研究现状

1.3 本文研究内容

第2章 音频信号预处理技术和特征提取

2.1 音频信号的预处理

2.2 MFCC特征

2.3 LPCC特征

2.4 差分系数的提取

2.5 本章小结

第3章 基于BIC的高效音频分割方法

3.1 贝叶斯信息准则BIC

3.2 BIC在音频分割中的应用

3.3 基于BIC的高效分阶段音频分割方法

3.4 本章小结

第4章 音频分割系统实现和实验分析

4.1 音频分割系统搭建

4.2 音频分割实验数据

4.3 实验结果评价标准

4.4 音频分割实验结果分析

4.5 本章小结

结论

参考文献

攻读学位期间发表的学术论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

展开▼

摘要

音频分割是指根据说话人特征、环境、信道条件,将音频流“自动”切分成若干同质区域的方法。由于其在音频检索、语音识别等应用中具有潜在价值,近年来受到了广泛关注。在各种音频分割方法中,由Chen等人提出的基于BIC的音频分割方法使用最为普遍,因为它具有很好的分割精度,但过大的计算量限制了其分割速度,无法满足实际需求。
  本文提出了一种基于BIC的高效的分阶段音频分割方法。不同于传统的“基于变长窗检测”的BIC方法和P. Delacourt等人提出的DISTBIC方法,该方法首先使用基于统计均值欧式距离mEdist选出候选音频分割点,过程中包含对于局部峰值选取和显著性检测,然后使用BIC方法对于候选分割点进行确认,最后使用基于能量的检测方法以减少对于短时静音段的插入错误。实验结果表明该方法不仅在很大程度上提高了整体音频分割速度,较之传统的BIC方法提高了400倍,而且使得删除错误率MDR降低了19.2%,当然插入错误率FAR略有提高,上升了3.8%。
  最后比较了MFCC特征和LPCC特征在不同应用场合中对于音频分割效果的影响,不仅验证了本文所提出的音频分割方法具有一定通用性,而且发现较之MFCC特征,LPCC特征在音频分割应用中具有更好的表现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号