首页> 中文学位 >基于节拍和关键背景模型的音频分类与分割
【6h】

基于节拍和关键背景模型的音频分类与分割

代理获取

目录

第1章 绪论

1.1课题背景及研究目的和意义

1.2国内外研究现状与分析

1.3研究内容和组织结构

第2章 音频分类分割概述

2.1引言

2.2音频信号预处理

2.3特征计算

2.4性能评价标准

2.5本章小结

第3章 基于随机森林的音频多分类

3.1引言

3.2基于随机森林的音频分类

3.3基于音频段的音频分割

3.4实验结果与分析

3.5本章小结

第4章 基于节拍的歌唱音乐与纯音乐分类

4.1引言

4.2节拍概述

4.3节拍跟踪

4.4基于节拍的分类方法

4.5实验结果与分析

4.6本章小结

第5章 基于关键背景模型的语音分割

5.1引言

5.2 GSSG分割方法

5.3模型训练

5.4 GSH特征计算

5.5聚类算法

5.6实验结果与分析

5.7本章小结

结论

参考文献

声明

致谢

展开▼

摘要

音频数据分类分割是音频数据处理系统最常用、最重要的预处理技术,显著地影响系统的性能和效果,具有重要的研究价值。在音频样例检索系统中,需要为操作人员提供便捷、高效的样例提取工具,从多媒体文件中截取音频片段,作为查询的样例数据。截取的样例一般是包含操作人员感兴趣、含有重要信息、内容具有一定完整性的片段。尽管音频信息无法快速浏览,但如果在操作人员截取音频样例之前,先使用音频分割分类技术获取音频文件内容的结构化信息,然后采用可视化技术呈现给操作人员,将便于操作人员快速浏览文件内容、便捷、高效地选取音频片段,完成样例制作任务。
  本研究主要内容包括:⑴采用随机森林算法实现音频的粗分类,将音频数据分为音乐、纯语音、含背景音乐语音、含背景噪音语音和背景音,共五类。采用基于音频段的分割方法实现音频的粗分割,将音频数据分为音乐、语音和背景音三大段。⑵对于音乐类数据,针对操作人员更多关注有歌声音乐而非纯音乐的特点,提出了基于节拍的分类方法,将音乐类数据细分为纯音乐与有歌声音乐两种。实验结果表明,该方法对于不同类型的音乐数据均具有较好的性能。⑶对于语音类数据,如果语音时长过长,不利于快速地选择样例片段的提取位置。提出了基于高斯统计直方图特征和单高斯关键背景模型的语音分割方法。训练单高斯模型并优选关键背景模型,采用统计方法将梅尔倒谱系数特征映射为直方图特征,并用基于余弦距离的聚类方法进行聚类,聚类结果即为分割结果。利用该方法对语音类数据进行细分割,得到具有相对独立性的子片段作为候选的样例片段。实验结果表明本文提出的语音分割方法准确率高、速度快。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号