首页> 中文学位 >基于内容的音频分类方法研究
【6h】

基于内容的音频分类方法研究

代理获取

摘要

基于内容的音频分类是模式分类技术的一个重要应用方向,是音频检索和视频分析等技术的重要研究内容。当前,基于内容的音频分类技术研究集中在两个方面,一个是怎样从音频信号中提取表征音频内容的特征信息,另一个是怎样针对音频信息特征构建分类器模型。
   在现有音频特征提取和音频分类技术基础上,以足球比赛中的音频分类为具体应用,音频信息分为噪音、解说员语音、哨音、欢呼声和带背景音的解说员语音等5个类别。音频特征提取是基于内容的音频分类的前提和基础。按照MPEG-7 音频标准,提取帧层次和段层次上的音频特征,包括过零率、短时能量、频谱质心等,根据各类音频信息的不同特点,有针对性地选取特征构造特征向量,并将不同的特征组合应用于音频分类。基于内容的音频分类的难点是如何构造分类器,建立音频的低级声学特征与高级类别特征之间的映射关系。基于决策树的分类方法,设计实现了一种层次化的音频分类器。区别于传统的方法,它不是企图用一个算法或一个决策规则将多个类别一次分开,而是把一个复杂的多分类问题转化为若干个简单的分类问题,采用分级的方式逐步解决。
   实验表明,提取的特征有效,分类效果良好。随着研究的进一步深入,所取得的研究成果必将在实践中得到很好的应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号